Я хочу извлечь некоторый текст из html-страницы с помощью Scrapy.
Один из элементов содержит символ <
, который не закодирован как <
(страница не является допустимым html).
Например
<div>
years < 7
</div>
С XPath (в Chrome или в коде Scapy) с использованием '//div/text()'
я могу извлечь только 'years'
Есть ли способ получить полный текст, т.е. 'years < 7'
?
//div[not(*)]
и получите.textContent
результатов? - person Tomalak   schedule 13.11.2013