В python 3 я хочу получить ссылки с фотографий, которые находятся на определенных страницах, например:
http://divulgacandcontas.tse.jus.br/divulga/#/candidato/2018/2022802018/AC/10000600209
http://divulgacandcontas.tse.jus.br/divulga/#/candidato/2018/2022802018/SP/250000627809
Я сделал так:
from urllib.request import urlopen
from bs4 import BeautifulSoup
import urllib.request, urllib.parse, urllib.error
html = urlopen('http://divulgacandcontas.tse.jus.br/divulga/#/candidato/2018/2022802018/AC/10000600209')
soup = BeautifulSoup(html, "html.parser")
link = soup.find("img", {"class": "img-thumbnail img-responsive dvg-cand-foto"})
print(link)
None
html = urlopen('http://divulgacandcontas.tse.jus.br/divulga/#/candidato/2018/2022802018/SP/250000627809')
soup = BeautifulSoup(html, "html.parser")
link = soup.find("img", {"class": "img-thumbnail img-responsive dvg-cand-foto"})
print(link)
None
Я намеревался собрать набор предметов рядом с фотографией и определить другую стратегию, чтобы получить точную точку источника. Как: http://divulgacandcontas.tse.jus.br/candidaturas/oficial/2018/BR/AC/2022802018/10000600209/foto_1532971768767.jpg
Но то, что появляется в Inspect Element браузера Firefox (img class='img-thumbnail img-responsive dvg-cand-foto'), не совпадает с собранным html.parser.
Пожалуйста, кто-нибудь знает, как я могу собрать эту ссылку на фото на сайте?
-/-
С применением селена:
from selenium import webdriver
from selenium.common.exceptions import NoAlertPresentException
from selenium.webdriver.support.select import Select
from bs4 import BeautifulSoup
profile = webdriver.FirefoxProfile()
browser = webdriver.Firefox(profile)
browser.implicitly_wait(10)
browser.get('http://divulgacandcontas.tse.jus.br/divulga/#/candidato/2018/2022802018/SP/250000627809')
html = browser.page_source
soup = BeautifulSoup(html, "html.parser")
browser.close()
link = soup.find("img", {"class": "img-thumbnail img-responsive dvg-cand-foto"})['src']
print(link)
http://divulgacandcontas.tse.jus.br/candidaturas/oficial/2018/BR/SP/2022802018/250000627809/foto_1534447872273.jpg