Вопросы по теме 'jsoup'

JSoup не переводит амперсанд в ссылки в html
В JSoup должен пройти следующий тестовый пример, это не так. @Test public void shouldPrintHrefCorrectly(){ String content= "<li><a href=\"#\">Good</a><ul><li><a...
1016 просмотров
schedule 01.02.2024

Извлечение данных из html-кода с помощью Jsoup
Я хочу извлечь из этого HTML-кода слово Mustafa с помощью Jsoup. <h1 id="firstHeading" class="firstHeading">Mustafa</h1> <!-- /firstHeading --> Как я могу это сделать?
1500 просмотров
schedule 01.02.2024

Jsoup: безопасные элементы.get(0)
Следующий фрагмент кода извлекает один и только один элемент, а именно элемент first : String linkHref = ""; String linkText = ""; Elements links = div.getElementsByTag("a"); for (Element link : links) { linkHref = link.attr("href");...
2365 просмотров
schedule 23.11.2023

Избегайте конкатенации без пробелов с помощью JSoup
Предположим, у меня есть div как таковой: <div> This is a paragraph written by someone on the internet. </div> Проблема в том, что когда JSoup анализирует это, он помещает все это в одну строку, поэтому, когда я вызываю text(), он...
3232 просмотров
schedule 02.11.2023

Jsoup: выбор HTML между разными классами
Я пытаюсь сделать что-то похожее на: Jsoup: Как получить весь html между двумя тегами заголовка Однако, похоже, мой код избегает простого текста. Сайт, который я разбираю, имеет настройку кода таким образом: div class = "quoted-message"...
1569 просмотров
schedule 22.01.2024

Проблема разбора Jsoup Html с поиском данных внутренних ссылок
Обычно у нас много внутренних ссылок в файле. Я хочу проанализировать html-файл, чтобы получить заголовки страницы и соответствующие данные на карте. Что я сделал: 1) Получил все элементы внутренней ссылки 2) Проанализировал документ на наличие id...
1830 просмотров
schedule 02.10.2022

Jsoup как парсер для C ++ / C?
Есть ли какой-нибудь Jsoup / jQuery с открытым исходным кодом, например движок парсера / селектора для C ++ / C?
3477 просмотров
schedule 03.01.2024

Android jsoup выбирает ячейки таблицы
Привет, я пытаюсь получить некоторую информацию с веб-сайта (http://omhc.nl/site/default.asp?Option=10017&m=1). Структура таблицы такая: <tr> <td colspan="4" style="border-bottom: 1px solid rgb(0, 0, 0);" width="100%">donderdag 19...
859 просмотров
schedule 16.01.2024

Как распечатать элемент в JSoup с помощью Java
Я написал функцию на Java для получения 10 ссылок по их идентификаторам с заданного URL-адреса. Идентификаторы тегов href в HTML-коде записываются как: id-1 , id-2 и т. д. Я использую библиотеку JSoup. Мой код: public static void...
3820 просмотров
schedule 09.12.2023

таблица jsoup для получения определенного элемента
Document doc = Jsoup.connect(studentprofiles).get(); Element tables = doc.select("table"); Elements myTdsstudent = tables.select("tr td:eq(1)"); Я могу получить все детали одну за другой в eq(1). В примере: Table: GK 99 NS 88...
720 просмотров
schedule 10.06.2024

Получить текст после тега html с помощью Jsoup и создать ArrayList
Я пытаюсь получить текст из HTML-документа в ArrayList, используя Jsoup. Мой документ выглядит так. <p> <b>1</b>First Text <b>2</b>Second Text <b>3</b>Third Text . . . . </p>...
4374 просмотров
schedule 14.12.2023

Разбор таблицы в jsoup (Android)
http://www.novaprojecten.nl/roosters/lbl/basis/38/c/c00086.htm я пытаюсь разобрать увиденную там таблицу... я хочу поместить все дни (первая строка) в ListView. Когда я нажимаю элемент ListView в день, я хочу показать данные в столбце ниже...
709 просмотров
schedule 02.12.2022

Android — Jsoup — исключение SocketTimeoutException
Я пытаюсь разработать приложение для Android, в котором используется основная библиотека jsoup-1.7.1.jar. Я включил файл jar в качестве библиотеки, но теперь, когда я хочу его использовать, я каждый раз получаю исключение SocketTimeoutException. Я...
1278 просмотров
schedule 10.02.2024

Java jsoup с использованием потоков не работает
У меня есть похожие страницы примерно так: www.foo1.bar www.foo2.bar www.foo3.bar . . www.foo100.bar Я использую библиотеку jsoup и подключаюсь к каждой странице одновременно с Thread : Thread matchThread = new Thread(task);...
6596 просмотров
schedule 25.02.2024

Использует ли Jsoup базовый тег html-документа для автоматического разрешения относительного пути
Насколько я понимаю, синтаксический анализатор jsoup позволяет работать с относительными ссылками, если при создании экземпляра синтаксического анализатора указан базовый URI. Теперь предположим, что документ определяет базовый тег с URI, который...
371 просмотров
schedule 29.09.2022

Android – использование Jsoup с html-файлом android_asset
Хорошо, я использую Jsoup для анализа html с удаленных URL-адресов, используя: Jsoup.connect(url).timeout(20000).get(); Теперь я пытаюсь прочитать локальные файлы html, которые я сохранил в папке assets . Я много искал, но не могу найти...
2197 просмотров
schedule 15.11.2023

URL-адрес извлечения JSoup не работает
У меня есть URL этой веб-страницы, указанный для получения URL-адреса JSoallow и использования rel="nofollow"> URL. try{ doc = Jsoup.connect(url).timeout(5000).get(); }catch(IOException e){ e.printStackTrace(); } Но я получаю...
4829 просмотров
schedule 18.02.2024

jsoup, чтобы удалить только теги html, а не символ новой строки?
У меня есть содержимое ниже на Java, где я хочу удалить только теги html, но не символы новой строки. <p>test1 <b>test2</b> test 3 </p> //line 1 <p>test4 </p> //line 2 Если я открою вышеуказанное содержимое...
7306 просмотров
schedule 06.05.2024

Исключение jsoup SocketTimeout
Jsoup выдает ошибку тайм-аута. Как я могу это исправить? Строка кода, которая дает ошибку, Document doc; doc = Jsoup.connect("http://google.com").timeout(300000).get(); Исключение, которое я получаю, это...
1875 просмотров
schedule 19.04.2024

как извлечь определенный контент с веб-страницы с помощью jsoup
Мне нужно извлечь ТОЛЬКО эти публикации с веб-страницы http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html , где первым автором является Рахул Рао. Я пробовал следующий код, но он не дает мне никакого результата. for( Element...
458 просмотров
schedule 10.10.2022