Я хочу найти способ получить все подэлементы дерева элементов, как это делает ElementTree.getchildren()
, поскольку getchildren()
устарел, начиная с Python версии 2.7.
Я больше не хочу его использовать, хотя все еще могу используйте его в настоящее время.
Как получить все подэлементы дерева элементов с помощью Python ElementTree?
Ответы (5)
Все подэлементы (потомки) elem
:
all_descendants = list(elem.iter())
Более полный пример:
>>> import xml.etree.ElementTree as ET
>>> a = ET.Element('a')
>>> b = ET.SubElement(a, 'b')
>>> c = ET.SubElement(a, 'c')
>>> d = ET.SubElement(a, 'd')
>>> e = ET.SubElement(b, 'e')
>>> f = ET.SubElement(d, 'f')
>>> g = ET.SubElement(d, 'g')
>>> [elem.tag for elem in a.iter()]
['a', 'b', 'e', 'c', 'd', 'f', 'g']
Чтобы исключить сам корень:
>>> [elem.tag for elem in a.iter() if elem is not a]
['b', 'e', 'c', 'd', 'f', 'g']
iter()
. Элемент также ведет себя как список; поэтому вы также можете индексировать подэлементы.
- person pepr; 02.05.2012
getchildren()
также возвращает только непосредственных потомков. Старым эквивалентом нового list(elem.iter())
является list(elem.getiterator())
. Это зависит от того, чего на самом деле хочет Стивен.
- person pepr; 02.05.2012
в pydoc упоминается использование метода list() над узлом для получения дочерних элементов.list(elem)
list()
уже было предложено в предыдущих ответах, а также в ответе, помеченном как правильный. В этом ответе не было особой необходимости.
- person Goran Kutlaca; 22.08.2018
Если вы хотите получить все элементы «a», вы можете использовать:
a_lst = list(elem.iter('a'))
Если elem
также является 'a', он будет включен.
Возможно, это не соответствует фактическому вопросу OP, но в более широком смысле я бы предположил, что если кто-то хочет, чтобы все элементы были названы определенным именем, например. 'object' может использовать (альтернативный подход к @Turtles Are Cute, который мне, по крайней мере, кажется более естественным):
objs = tree.findall('object')
который также возвращает список.
Ни один из существующих ответов не найдет всех детей. Это решение использует BeautifulSoup вместо ETree, но найдет все дочерние элементы, а не только верхний уровень:
from bs4 import BeautifulSoup
with open(filename) as f:
soup = BeautifulSoup(f, 'xml')
results = soup.find_all('element_name')