Свързани въпроси 'jsoup'

Jsoup не получава пълен html
Опитвам се с Jsoup да анализирам html от URL адреса http://www.threadflip.com/shop/search/john%20hardy Jsoup гледа да получава данните само от линията <![CDATA[ window.gon= .............. Някой знае ли защо е така? Document doc =...
628 изгледи
schedule 25.09.2022

Изключете URL адреса без изображение с помощта на jsoup java
Имам следния код, който работи перфектно, за да получа URL адреса на изображението от уеб страница и след това да го изтегля. Но някъде изображението не е намерено и съхранява фиктивен png. Искам, ако „Няма налично изображение“, то да не изтегля...
51 изгледи
schedule 22.09.2022

Проблем с анализа на Jsoup Html при намиране на данни за вътрешни връзки
Обикновено имаме много вътрешни връзки в един файл. Искам да анализирам html файл така, че да получа заглавията на страница и съответните й данни в карта. Стъпки, които направих: 1) Получих всички вътрешни референтни елементи 2) Анализирах...
1830 изгледи
schedule 02.10.2022

Jsoup използва ли базовия таг на html документ за автоматично разрешаване на относителен път
Доколкото разбирам, синтактичният анализатор jsoup позволява да се работи с относителни връзки, стига да се посочи базов URI адрес при инстанцирането на парсера. Нека сега приемем, че документът дефинира основен таг с URI, който е различен от URI...
371 изгледи
schedule 29.09.2022

Необходим е неизвестен селектор за анализ на HTML
Използвайки Jsoup html анализираща java библиотека, намерих това от уебсайт: <div class="jobCardListingTitle"> <a href="/bg/jobs/hospitality-tourism/other/listing-846200105.htm"...
38 изгледи
schedule 02.10.2022

Изтрийте данни от уеб приложение, проектирано с помощта на AngularJS
Искам да изтрия данни от WebApp с помощта на JSoup. Но проблемът е, че уеб приложението не съхранява името на обекта, то просто използва променлива за показване на съдържание. Например: Expedia използва променливата 'hotelName', за да покаже...
562 изгледи
schedule 30.09.2022

как да извлечете конкретно съдържание от уеб страница с помощта на jsoup
Трябва да извлека САМО тези публикации от уеб страницата http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html , където първият автор е Рахул Рао. Опитах следния код, но той не ми дава никакъв резултат. for( Element element :...
458 изгледи
schedule 10.10.2022

JSoup Не може да намери входен елемент
Опитвам се да използвам Jsoup, за да се свържа с developers.amazon.com. Ето моят код: Map<String, String> get_All_InputFields(Document loginPage) { Map<String, String> inputFieldMap = new HashMap<String, String>();...
307 изгледи
schedule 11.10.2022

JSoup извлича текста от таблицата td, която не съдържа никакви html възли
Имам html низ като този: String html="<table><tbody> <tr> <td><p>ABC</p></td> <td>DEF</td> </tr> <tr> <td><p>GHI</p></td> <td>MNO</td>...
1524 изгледи
schedule 11.10.2022

Избягвайте конкатенацията без пространство с JSoup
Да предположим, че имам div като такъв: <div> This is a paragraph written by someone on the internet. </div> Проблемът е, че когато JSoup анализира това, той поставя всичко на един ред, така че когато извикам text(), той се чете...
3232 изгледи
schedule 02.11.2023

Анализиране на таблица в jsoup (Android)
http://www.novaprojecten.nl/roosters/lbl/basis/38/c/c00086.htm опитвам се да анализирам таблицата, която се вижда там... това, което искам, е да поставя всички дни (първия ред) в ListView. Когато докосна елемента ListView на ден, искам да...
709 изгледи
schedule 02.12.2022

Jsoup - извличане на етикет: пространство от имена
Имам проблеми с извличането на някои данни от уеб страница с помощта на Jsoup. Ето кода: <fb:comments-count href="/bg" fb-xfbml-state="rendered" class=" fb_comments_count_zero"> <span...
789 изгледи
schedule 04.11.2022

Android - използване на Jsoup с android_asset html файл
Добре, използвах Jsoup за анализ на html от отдалечени URL адреси, използвайки: Jsoup.connect(url).timeout(20000).get(); Сега се опитвам да прочета локални html файлове, които съм съхранил в папката assets . Търсих много, но не мога да...
2197 изгледи
schedule 15.11.2023

Уеб скрапинг само на определен домейн
Опитвам се да направя уеб scrpper, който за този пример изтрива новинарски статии от Reuters.com. Искам да получа заглавието и датата. Знам, че в крайна сметка просто ще трябва да изтегля изходния код от всеки адрес и след това да анализирам HTML с...
1062 изгледи
schedule 11.11.2022

Jsoup: Безопасни елементи.get(0)
Следният кодов фрагмент извлича един и само един елемент, по-специално първия елемент: String linkHref = ""; String linkText = ""; Elements links = div.getElementsByTag("a"); for (Element link : links) { linkHref =...
2365 изгледи
schedule 23.11.2023

Не може да се ПУБЛИКУВА чрез jSoup
Опитвам се да извлека някои данни от уебсайт на рутер, но не мога да разбера заглавките на POST заявката. Ето заглавките на заявката: Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8...
1641 изгледи
schedule 13.11.2023

Извличане на текст извън HTML таг
Имам следния HTML код: <div class=example>Text #1</div> "Another Text 1" <div class=example>Text #2</div> "Another Text 2" Искам да извлека текста извън етикета, „Друг текст 1“ и „Друг текст 2“ Използвам JSoup, за...
1645 изгледи
schedule 30.10.2022

JSoup Премахване на елементи
Въпреки че това може да звучи твърде основно, бих искал да попитам как да премахна елемент от документ с помощта на Jsoup. Опитах да го потърся, но без успех. Ето го проблемът: Elements myNewElements = doc.getElementsByAttribute("hello");...
27064 изгледи
schedule 01.12.2023

Получаване на текст от между етикети в XML с помощта на jSoup
Опитвам се да получа стойността на <report_id> от следния израз <start_task_response status_text="OK, request submitted"...
517 изгледи
schedule 25.11.2022

Как да отпечатате елемента в JSoup с помощта на Java
Написах функция в Java за извличане на 10 връзки по техните идентификатори от даден URL. Идентификационните номера на маркера href в HTML кода са написани като: id-1 , id-2 и т.н. Използвам библиотека JSoup. Моят код е: public static...
3820 изгледи
schedule 09.12.2023