Не удается ПОЛУЧИТЬ файл cookie?

Если мы посетим этот URL в Chrome с открытыми инструментами разработки, мы сможем отчетливо видно, как появляется файл cookie (в инструментах разработчика Chrome -> «приложение» -> «файлы cookie»).

Если мы попытаемся сделать то же самое, используя httr::GET(), мы ожидаем увидеть cookie, но этого не происходит:

library(httr)

r <- GET("https://aps.dac.gov.in/LUS/Public/Reports.aspx")
r$cookies
# [1] domain     flag       path       secure     expiration name       value     
# <0 rows> (or 0-length row.names)

Почему это так и как мы можем получить файл cookie (вместе с HTML-кодом страницы), предпочтительно используя httr и/или rvest (плюс другие предложения, но без использования реального браузера, безголового или иного, включая селен )


person stevec    schedule 18.11.2019    source источник


Ответы (1)


Причина, по которой это происходит, заключается в том, что файл cookie на самом деле не создается до тех пор, пока пользователь не отправит форму (открыв инструменты разработчика Chrome и просматривая «приложение» -> «файлы cookie» до и после отправки формы, мы видим, что файл cookie появляется.

Обратите внимание, что это можно эмулировать с помощью chrome incognito (у него не будет доступа к файлам cookie в обычном chrome, поэтому его можно попробовать несколько раз для демонстрационных целей).

person stevec    schedule 19.11.2019
comment
Кто-нибудь нашел способ получить файл cookie и очистить страницу? Пробовал httr::set_cookies() но не пойму кому его использовать... - person Dominik Vogel; 17.10.2020
comment
@DominikVogel По какой-то причине я даже не мог получить печенье. Вы можете задать новый вопрос с вашим примером и дать ссылку на эту страницу. - person stevec; 17.10.2020
comment
Уже сделано: stackoverflow.com/questions/64391812/ - person Dominik Vogel; 17.10.2020