Работя по проект за уеб скрапинг и срещнах проблеми със скоростта. За да се опитам да го поправя, искам да използвам lxml вместо html.parser като парсер на BeautifulSoup. Успях да направя това:
soup = bs4.BeautifulSoup(html, 'lxml')
но не искам да се налага многократно да въвеждам 'lxml'
всеки път, когато извиквам BeautifulSoup. Има ли начин да задам кой парсер да използвам веднъж в началото на моята програма?
lxml
е по подразбиране вbs4
, ако приемем, че имате инсталиранlxml
. Така че освен ако случайно не работите с BeautifulSoup3... - person roippi   schedule 06.01.2015