Вопросы по теме 'lxml'
Сопоставление первого набора элементов с xpath
У меня есть XML-документ, который выглядит так.
<foo>
<bar type="artist"/> Bob Marley </bar>
<bar type="artist"/> Peter Tosh </bar>
<bar type="artist"/> Marlon Wayans </bar>
</foo>...
116 просмотров
schedule
12.04.2024
Как использовать lxml для захвата определенных частей XML-документа?
Я использую API Amazon для получения информации о книгах. Я пытаюсь использовать lxml для извлечения определенных частей документа XML, которые необходимы для моего приложения. Однако я не совсем уверен, как использовать lxml. Это насколько я...
9918 просмотров
schedule
21.09.2022
удаление встроенных тегов с помощью python lxml
Мне приходится иметь дело с двумя типами встроенных тегов в XML-документах. Теги первого типа заключают в себе текст, который я хочу оставить между ними. Я могу справиться с этим с помощью lxml
etree.tostring(element, method="text",...
3880 просмотров
schedule
18.12.2023
Как получить текущий URL-адрес проанализированной HTML-страницы в Python с помощью lxml?
В Python я анализирую различные URL-адреса, чтобы найти некоторые элементы в теле возвращаемого документа. Я использую для этого lxml, например:
import lxml.html as html
url = 'http://www.linktowebsite.com'
data = html.parse(url)
for d in...
826 просмотров
schedule
29.02.2024
Как установить lxml в Mac OS X 10.7.4? Я исчерпал все варианты
Пробовал разные пути, но безрезультатно. Я использую MBP с 10.7.4. Я не помню, когда в последний раз у меня было так много проблем с установкой чего-либо с Python на мой Mac. Пожалуйста, помогите мне использовать lxml на моем локальном компьютере и...
15512 просмотров
schedule
22.11.2023
Beautifulsoup4 с lxml против Beautifulsoup3
Я переношу некоторые синтаксические анализаторы с BeautifulSoup3 на BeautifulSoup4 и подумал, что было бы неплохо профилировать, насколько быстрее это будет происходить, учитывая, что lxml очень быстрый, и это парсер, который я использую с BS4, вот...
1720 просмотров
schedule
26.05.2024
Извлечь значение атрибута с помощью XPath в Python
У меня есть HTML:
<table>
<tbody>
<tr>
<td align="left" valign="top" style="padding: 0 10px 0 60px;">
<img src="/files/39.jpg" width="64" height="64">
</td>
<td align="left" valign="middle"><h1>30...
5688 просмотров
schedule
05.06.2024
Разбор XML с помощью ElementTree
Я пытаюсь искать теги и атрибуты в строке XML, используя ElementTree. Вот строка:
'<?xml version="1.0" encoding="UTF-8" ?>\n<uclassify xmlns="http://api.uclassify.com/1/ResponseSchema" version="1.01">\n\t<status success="true"...
439 просмотров
schedule
14.10.2022
Selenium/lxml: получить xpath
Есть ли метод get_xpath или способ сделать что-то подобное в селене или lxml.html. У меня такое чувство, что я где-то видел, но не могу найти ничего подобного в документах.
Псевдокод для иллюстрации:...
9921 просмотров
schedule
26.01.2024
Нужна помощь в создании отладочного lxml для python27 в Windows.
Я отлаживаю другую dll, импортированную скриптом, который использует lxml. Мне нужно создать objectify_d.pyd и etree_d.pyd из проекта lxml. Я успешно построил их, следуя инструкциям по сборке здесь: http://lxml.de/build.html , но используя эту...
744 просмотров
schedule
22.11.2022
Ведение журнала Python — разные журналы, но один и тот же вывод
У меня есть несколько разных синтаксических анализаторов для разных веб-сайтов, у меня также есть файл с именем shared.py , в котором есть функции lxml для специального синтаксического анализа и base.py файл, который отвечает за базу данных...
149 просмотров
schedule
28.09.2022
Получить данные между двумя тегами в Python
<h3>
<a href="article.jsp?tp=&arnumber=16">
Granular computing based
<span class="snippet">data</span>
<span class="snippet">mining</span>
in the views of rough set and fuzzy set
</a>
</h3>...
1709 просмотров
schedule
28.02.2024
Scrapy отображает текст xpath с помощью lxml
Как я могу заставить свою страницу parse_page отображать текст и числовое значение для названия моего элемента? Я могу отображать только href.
def parse_page(self, response):
self.log("\n\n\n Page for one device \n\n\n")
self.log('Hi,...
987 просмотров
schedule
24.11.2023
Параметр pretty_print в tostring не работает в lxml
Я пытаюсь использовать метод tostring в XML, чтобы получить "красивую" версию моего XML в виде строки. Пример на сайте lxml показывает этот пример:
>>> import lxml.etree as etree
>>> root = etree.Element("root")
>>>...
6722 просмотров
schedule
07.04.2024
Unicode: вывод файла Python/lxml не соответствует ожиданиям (печать или запись)
Я разбираю файл xml, используя приведенный ниже код:
import lxml
file_name = input('Enter the file name, including .xml extension: ')
print('Parsing ' + file_name)
from lxml import etree
parser = lxml.etree.XMLParser()
tree =...
461 просмотров
schedule
06.11.2023
Не удалось установить lxml версии 3.3.5 в Ubuntu
Я использую пакет python openpyxl в своем приложении. Я получаю следующее сообщение при использовании того же самого.
/usr/local/lib/python2.7/dist-packages/openpyxl/ init .py:31: UserWarning: установленная версия lxml слишком старая для...
8308 просмотров
schedule
04.12.2023
Как визуализировать XML-элемент так, как он будет отображаться во всем документе?
Я пытаюсь выполнить подпись XML для веб-службы SOAP. Частично это включает в себя получение буквальной строки элемента XML и ее переваривание с использованием SHA1. Проблема, с которой я сталкиваюсь, заключается в том, что если я найду элемент для...
412 просмотров
schedule
18.12.2023
Python анализирует определенные данные в таблице html, используя lxml и xpath
Прежде всего, я новичок в python и Stack Overflow, поэтому, пожалуйста, будьте добры.
Это исходный код html-страницы, из которой я хочу извлечь данные.
Веб-страница: http://gbgfotboll.se/information/?scr=table&ftid=51168 Таблица находится...
3918 просмотров
schedule
19.12.2023
Использование pyKML для анализа документа KML
Я использую модуль pyKML для извлечения координат из заданного файла KML.
Мой код Python выглядит следующим образом:
from pykml import parser
fileobject = parser.fromstring(open('MapSource.kml', 'r').read())
root =...
2722 просмотров
schedule
28.02.2024
lxml — получить плоский список элементов
Я хотел бы сгладить etree lxml (в частности, HTML, если это имеет значение). Как мне получить плоский список всех элементов в дереве?
7525 просмотров
schedule
17.12.2023