Имам URL:
http://www.goudengids.be/qn/business/advanced/where/Provincie%20Antwerpen/what/restaurant
На тази страница има бутон „следващи резултати“, който зарежда още 20 точки от данни, докато все още показва първия набор от данни, без да актуализира URL адреса. Написах скрипт за изтриване на тази страница в python, но той изтрива само първите 22 точки от данни, въпреки че е щракнат върху бутона „следващи резултати“ и показва около 40 данни.
Как мога да изтрия тези видове уебсайтове, които динамично зареждат съдържание
Сценарият ми е
import csv
import requests
from bs4 import BeautifulSoup
url = "http://www.goudengids.be/qn/business/advanced/where/Provincie%20Antwerpen/what/restaurant/"
r = requests.get(url)
r.content
soup = BeautifulSoup(r.content)
print (soup.prettify())
g_data2 = soup.find_all("a", {"class": "heading"})
for item in g_data2:
try:
name = item.text
print name
except IndexError:
name = ''
print "No Name found!"