Если мы посетим этот URL в Chrome с открытыми инструментами разработки, мы сможем отчетливо видно, как появляется файл cookie (в инструментах разработчика Chrome -> «приложение» -> «файлы cookie»).
Если мы попытаемся сделать то же самое, используя httr::GET()
, мы ожидаем увидеть cookie, но этого не происходит:
library(httr)
r <- GET("https://aps.dac.gov.in/LUS/Public/Reports.aspx")
r$cookies
# [1] domain flag path secure expiration name value
# <0 rows> (or 0-length row.names)
Почему это так и как мы можем получить файл cookie (вместе с HTML-кодом страницы), предпочтительно используя httr
и/или rvest
(плюс другие предложения, но без использования реального браузера, безголового или иного, включая селен )