Мне нужен Python Warrior, чтобы помочь мне (я нуб)! Я пытаюсь очистить определенные данные с сайта внутри сети, используя модуль urllib. Однако, поскольку это веб-сайт моей компании, который доступен только для просмотра сотрудниками, а не для публики, я думаю, именно поэтому я получаю этот код:
IOError: («Ошибка http», 401, «Не авторизовано», )
Как я пришел к этому? Он даже не будет читать сайт, используя htmlfile.read()
Пример кода для получения общедоступного сайта:
import urllib
import re
htmlfile = urllib.urlopen("http://finance.yahoo.com/q?s=AAPL")
htmltext = htmlfile.read()
regex = '<span id="yfs_l84_aapl">(.+?)</span>'
pattern = re.compile(regex)
price = re.findall(pattern,htmltext)
print price