Вопросы по теме 'html-agility-pack'

Получение метатегов и комментариев с помощью HTML Agility Pack
Я искал учебные пособия по использованию HTML Agility Pack, поскольку он, кажется, делает все, что я хочу, но кажется, что для такого мощного инструмента в Интернете мало шума о нем. Я пишу простой метод, который извлекает любой заданный тег на...
3937 просмотров
schedule 20.10.2022

Как я могу разобрать этот файл HTML?
<div id="main"> <style type="text/css"> </style> <script language="JavaScript"> </script> <p style="margin: 0pt 0pt 0.5em;"><b>Media from&nbsp;<a onclick="(new...
146 просмотров
schedule 06.06.2024

HTML Agility Pack - может загружать XML-документ только из файловой системы, а не из Интернета.
Раньше я успешно использовал HAP, загружая xhtml-страницы из Интернета. Однако теперь я пытаюсь загрузить и проанализировать XML-документы. HAP будет загружать только XML-документы, расположенные в моей файловой системе, например,...
4407 просмотров
schedule 19.10.2022

пакет xpath и htmlagility
Я понял! Я оставлю это сообщение на тот случай, если у кого-то из новичков, таких как я, возникнет тот же вопрос. Ответ: **("./td[2]/span[@class='smallfont']")** * Я новичок в гибкости xpath и html. Я так близко, но так далеко. ЦЕЛЬ:...
391 просмотров

re:test() XPath для HtmlAgilityPack (получить все теги p с соответствующим внутренним регулярным выражением)
Мне нужны все теги <p>=.+=</p> . Regex работает сам по себе, без тегов <p> . Вот мой XPath: "//p[re:test(.,'^=.+=$', 'i')]" Но я получаю исключение, когда подключаю его, HtmlNodeCollection pNodes =...
3412 просмотров
schedule 18.09.2022

Разве это не подходящий сценарий для синтаксического анализатора HTML?
Мне приходится иметь дело с неверными тегами Html и Html внутри атрибутов Html: <p class="<sometag attr="something"></sometag>"> <a href="<someothertag></someothertag">Link</a> </p> Я...
155 просмотров
schedule 04.04.2024

Использование HTMLAgilityPack для получения всех значений выбранного элемента
Вот что у меня есть до сих пор: HtmlAgilityPack.HtmlDocument ht = new HtmlAgilityPack.HtmlDocument(); TextReader reader = File.OpenText(@"C:\Users\TheGateKeeper\Desktop\New folder\html.txt"); ht.Load(reader);...
4813 просмотров
schedule 12.06.2024

Кодировка HtmlAgilityPack UTF-8
Я использую HtmlAgilityPack для синтаксического анализа моего html-документа, но я не могу получить правильный html. Например: string s="<!DOCTYPE html> <li>Voltage: <0.05% + 10 mV (<0.1% + 25 mV...
1456 просмотров
schedule 09.10.2022

Удалите все пустые/ненужные узлы из HTML
Каким будет предпочтительный способ удалить все пустые и ненужные узлы? Например <p></p> следует удалить, а <font><p><span><br></span></p></font> также следует удалить (поэтому тег br в...
5463 просмотров
schedule 12.06.2024

Пакет гибкости html Ссылка на объект не установлена ​​​​на экземпляр объекта
Я для синтаксического анализа html использую Html Agility Pack и так далее Grate, но я столкнулся с некоторыми плохими вещами: | это мой фоновый код public static HtmlDocument GetXHtmlFromUri2(string uri) { HttpClient client =...
3252 просмотров
schedule 20.11.2023

Выберите ссылку внутри тега div
Я хотел бы получить ссылку (точнее, URL) внутри класса div. Это код, который у меня есть, который получает текст внутри класса div ( Some text... ). foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@class='content']")) { //saves...
1426 просмотров
schedule 20.03.2024

Анализ HTML-таблицы в PowerShell V3
У меня есть следующая HTML-таблица Ссылка на HTML Я хочу проанализировать его и преобразовать в объект XML/CSV/PS, я пытался сделать это с помощью HtmlAgilityPack.dll, но безуспешно. Может ли кто-нибудь дать мне какие-либо указания, как это...
7085 просмотров
schedule 25.01.2024

Суммировать столбец в html-таблице с использованием C# и html-agility-pack
Как суммировать значения в определенном столбце определенной таблицы, когда количество строк непредсказуемо? Обратите внимание, что строка заголовка содержит текст и использует "" вместо "". Используя пример html ниже, я хотел бы суммировать...
968 просмотров
schedule 01.03.2024

HtmlAgilityPack Attributes.Remove on Image Удаляет только один, когда их два
В нашем проекте я использую HtmlAgilityPack , чтобы отображать HTML-код из другой нашей системы. Я столкнулся с этой проблемой в своем модульном тестировании и хочу убедиться, что я не делаю что-то неправильно. Если у меня есть изображение, и оно...
1531 просмотров
schedule 04.02.2024

XPath, предоставленный Google Chrome, неверен
Я пытаюсь проанализировать этот веб-сайт http://www.nasdaq.com/symbol/goog/financials?query=income-statement . Я пытаюсь получить значение 50 175 000. Это строка «Общий доход» в столбце на 31 декабря 2012 г. Google Chrome предоставляет XPath,...
315 просмотров

текст, возвращаемый как NULL, с использованием пакета htmlagility + xpath
В настоящее время я играю с пакетом htmlagility, однако, похоже, я не получаю никаких данных со следующего URL-адреса: http://cloud.tfl.gov.uk/TrackerNet/LineStatus Это код, который я использую: var url =...
46 просмотров
schedule 16.10.2022

VB.net извлекает ссылки из поиска Google с помощью HtmlAgilityPack
Теперь я обновил свой код в качестве теста. Я хочу перечислить все URL-адреса, в которых есть слово index.php, но он также отображает другие вещи. Вот мой рабочий код: Private Sub Button1_Click(sender As Object, e As EventArgs) Handles...
4263 просмотров
schedule 27.03.2024

HTMLAgilityPack — для включения этой функции необходимо установить для свойства UseIdAttribute значение true.
Я пытаюсь использовать HTMLAgilityPack с VS2008/.Net 3.5. Я получаю эту ошибку, даже если я установил для OptionUseIdAttribute значение true, хотя по умолчанию он должен быть истинным. Error Message: You need to set UseIdAttribute property to...
2958 просмотров
schedule 24.01.2024

Как извлечь следующую строку с помощью HTMLAgilityPack?
Я хотел бы извлечь цену из следующей строки HTML: <span class="bold colorwhite size11 floatLeft textCenter cartbox_right">&euro; 150,42</span> Веб-сайт делает это немного проще, поскольку этот класс span существует только один...
75 просмотров
schedule 24.04.2024

HTMLAgilityPack: необходимо извлечь значение colspan и другие
Пытаюсь читать по расписанию в инете. Это часть html-кода: <TR> <TD rowspan=12 align="center" nowrap="1"> <TABLE> <TR> <TD align="center" nowrap=1><font size="3"...
879 просмотров
schedule 03.04.2024