Вопросы по теме 'lxml'

Сопоставление первого набора элементов с xpath
У меня есть XML-документ, который выглядит так. <foo> <bar type="artist"/> Bob Marley </bar> <bar type="artist"/> Peter Tosh </bar> <bar type="artist"/> Marlon Wayans </bar> </foo>...
116 просмотров
schedule 12.04.2024

Как использовать lxml для захвата определенных частей XML-документа?
Я использую API Amazon для получения информации о книгах. Я пытаюсь использовать lxml для извлечения определенных частей документа XML, которые необходимы для моего приложения. Однако я не совсем уверен, как использовать lxml. Это насколько я...
9918 просмотров
schedule 21.09.2022

удаление встроенных тегов с помощью python lxml
Мне приходится иметь дело с двумя типами встроенных тегов в XML-документах. Теги первого типа заключают в себе текст, который я хочу оставить между ними. Я могу справиться с этим с помощью lxml etree.tostring(element, method="text",...
3880 просмотров
schedule 18.12.2023

Как получить текущий URL-адрес проанализированной HTML-страницы в Python с помощью lxml?
В Python я анализирую различные URL-адреса, чтобы найти некоторые элементы в теле возвращаемого документа. Я использую для этого lxml, например: import lxml.html as html url = 'http://www.linktowebsite.com' data = html.parse(url) for d in...
826 просмотров
schedule 29.02.2024

Как установить lxml в Mac OS X 10.7.4? Я исчерпал все варианты
Пробовал разные пути, но безрезультатно. Я использую MBP с 10.7.4. Я не помню, когда в последний раз у меня было так много проблем с установкой чего-либо с Python на мой Mac. Пожалуйста, помогите мне использовать lxml на моем локальном компьютере и...
15512 просмотров
schedule 22.11.2023

Beautifulsoup4 с lxml против Beautifulsoup3
Я переношу некоторые синтаксические анализаторы с BeautifulSoup3 на BeautifulSoup4 и подумал, что было бы неплохо профилировать, насколько быстрее это будет происходить, учитывая, что lxml очень быстрый, и это парсер, который я использую с BS4, вот...
1720 просмотров

Извлечь значение атрибута с помощью XPath в Python
У меня есть HTML: <table> <tbody> <tr> <td align="left" valign="top" style="padding: 0 10px 0 60px;"> <img src="/files/39.jpg" width="64" height="64"> </td> <td align="left" valign="middle"><h1>30...
5688 просмотров
schedule 05.06.2024

Разбор XML с помощью ElementTree
Я пытаюсь искать теги и атрибуты в строке XML, используя ElementTree. Вот строка: '<?xml version="1.0" encoding="UTF-8" ?>\n<uclassify xmlns="http://api.uclassify.com/1/ResponseSchema" version="1.01">\n\t<status success="true"...
439 просмотров
schedule 14.10.2022

Selenium/lxml: получить xpath
Есть ли метод get_xpath или способ сделать что-то подобное в селене или lxml.html. У меня такое чувство, что я где-то видел, но не могу найти ничего подобного в документах. Псевдокод для иллюстрации:...
9921 просмотров
schedule 26.01.2024

Нужна помощь в создании отладочного lxml для python27 в Windows.
Я отлаживаю другую dll, импортированную скриптом, который использует lxml. Мне нужно создать objectify_d.pyd и etree_d.pyd из проекта lxml. Я успешно построил их, следуя инструкциям по сборке здесь: http://lxml.de/build.html , но используя эту...
744 просмотров
schedule 22.11.2022

Ведение журнала Python — разные журналы, но один и тот же вывод
У меня есть несколько разных синтаксических анализаторов для разных веб-сайтов, у меня также есть файл с именем shared.py , в котором есть функции lxml для специального синтаксического анализа и base.py файл, который отвечает за базу данных...
149 просмотров
schedule 28.09.2022

Получить данные между двумя тегами в Python
<h3> <a href="article.jsp?tp=&arnumber=16"> Granular computing based <span class="snippet">data</span> <span class="snippet">mining</span> in the views of rough set and fuzzy set </a> </h3>...
1709 просмотров
schedule 28.02.2024

Scrapy отображает текст xpath с помощью lxml
Как я могу заставить свою страницу parse_page отображать текст и числовое значение для названия моего элемента? Я могу отображать только href. def parse_page(self, response): self.log("\n\n\n Page for one device \n\n\n") self.log('Hi,...
987 просмотров

Параметр pretty_print в tostring не работает в lxml
Я пытаюсь использовать метод tostring в XML, чтобы получить "красивую" версию моего XML в виде строки. Пример на сайте lxml показывает этот пример: >>> import lxml.etree as etree >>> root = etree.Element("root") >>>...
6722 просмотров
schedule 07.04.2024

Unicode: вывод файла Python/lxml не соответствует ожиданиям (печать или запись)
Я разбираю файл xml, используя приведенный ниже код: import lxml file_name = input('Enter the file name, including .xml extension: ') print('Parsing ' + file_name) from lxml import etree parser = lxml.etree.XMLParser() tree =...
461 просмотров
schedule 06.11.2023

Не удалось установить lxml версии 3.3.5 в Ubuntu
Я использую пакет python openpyxl в своем приложении. Я получаю следующее сообщение при использовании того же самого. /usr/local/lib/python2.7/dist-packages/openpyxl/ init .py:31: UserWarning: установленная версия lxml слишком старая для...
8308 просмотров
schedule 04.12.2023

Как визуализировать XML-элемент так, как он будет отображаться во всем документе?
Я пытаюсь выполнить подпись XML для веб-службы SOAP. Частично это включает в себя получение буквальной строки элемента XML и ее переваривание с использованием SHA1. Проблема, с которой я сталкиваюсь, заключается в том, что если я найду элемент для...
412 просмотров
schedule 18.12.2023

Python анализирует определенные данные в таблице html, используя lxml и xpath
Прежде всего, я новичок в python и Stack Overflow, поэтому, пожалуйста, будьте добры. Это исходный код html-страницы, из которой я хочу извлечь данные. Веб-страница: http://gbgfotboll.se/information/?scr=table&ftid=51168 Таблица находится...
3918 просмотров
schedule 19.12.2023

Использование pyKML для анализа документа KML
Я использую модуль pyKML для извлечения координат из заданного файла KML. Мой код Python выглядит следующим образом: from pykml import parser fileobject = parser.fromstring(open('MapSource.kml', 'r').read()) root =...
2722 просмотров
schedule 28.02.2024

lxml — получить плоский список элементов
Я хотел бы сгладить etree lxml (в частности, HTML, если это имеет значение). Как мне получить плоский список всех элементов в дереве?
7525 просмотров
schedule 17.12.2023