Java JSoup очищает img src с веб-сайта, возвращает странный URL-адрес

При попытке очистки: https://www.game.co.uk/webapp/wcs/stores/servlet/AjaxCatalogSearchView?searchTermScope=&searchType=&filterTerm=&catGroupId=&maxPrice=&contentOnly=&filterTermOperator=&RASchemaType=&attributeName1=Genre&sType=SimpleSearch&filterType=&resultCatEntryType=2&catalogId=10201&pageView=image&sortBy=MOST_POPULAR_DESC&minPrice=&categoryType=&attributeValue1=4294952868&storeId=10151&langId=44&catgrpSchemaType=&storeOnly=&searchTerm=rpg&searchTermOperator=&pageNumber=1&inStockOnly=true&pageSize=96

для img я получаю это как возврат:

/wcsstore/SafeStorefrontAssetStore/locale/en_GB/Style1/img/email/spacer.gif

Я пытался использовать .attr(abs:src), а также .attr(src), но оба возвращают неверные URL-адреса.

Elements prods = doc.select(".product");
Elements img = prods.get(i).select(".productHeader a img");
String imageUrl = img.attr("src");

person Matt    schedule 09.12.2020    source источник


Ответы (1)


я думаю, что ваша проблема в вашем селекторе:

Элементы img = prods.get(i).select(.productHeader›a›img);

Это должно решить вашу проблему!

НОВАЯ ЗАПИСЬ: вам нужно проверить data-src, который имеет URL-адрес изображения без протокола впереди String imageUrl = img.attr(data-src);

=› например //img.game.co.uk/ml2/7/3/1/5/731542_ps4_b.png

person oezzi    schedule 09.12.2020
comment
Все тот же возврат, что и раньше :( - person Matt; 10.12.2020
comment
хорошо, пришлось программировать java после такого долгого времени :) то, что вы ищете, это атрибут data-src ... единственное, чего не хватает, это протокол впереди: String imageUrl = img.attr(data-src); - person oezzi; 10.12.2020
comment
у вас была возможность попробовать data-src ? - person oezzi; 10.12.2020