Watir-webdriver против Mechanize, чтобы избежать evercookies\zombiecookies Amazon

Я работаю над тем, чтобы автоматически загружать и управлять материалами на платформе Amazon Kindle для нескольких учетных записей.

Кто-то, имеющий большой опыт работы с Amazon, сказал мне, что Amazon, как известно, использует своего рода постоянный файл cookie (который Думаю, это послужило поводом для пары судебных исков). Их можно хранить во флэш-памяти в виде сгенерированного файла .png, который затем принудительно кэшируется, и многое другое; проверьте ссылку. Я обеспокоен этим.

В настоящее время все сценарии, которые я использую для управления загрузками, написаны на Ruby и используют немного глючный, но, тем не менее, довольно удобный watir-webdriver. Насколько я понимаю, каждый экземпляр Firefox, управляемого watir-webdriver, является собственным уникальным экземпляром без файлов cookie. Но может ли Firefox по-прежнему передавать данные из этих файлов cookie на Amazon через флэш-память или любым другим умным способом? Я действительно не уверен.

Мои вопросы:

а) Что очищает watir-webdriver перед запуском нового «сеанса» браузера, кроме http cookies?

б) Теоретически, если я узнаю, где амазон оставляет эти куки, могу ли я вручную очищать их каждый раз перед запуском экземпляра браузера?

c) Если я перепишу сценарии, используя Mechanize, а не watir-webdriver, избежит ли это ВСЕХ этих проблем, поскольку mechanize (афаик) совершенно не может запускать код javascript?

Вы бы порекомендовали использовать mechanize, чтобы избежать этих файлов cookie?


person dsp_099    schedule 09.02.2012    source источник


Ответы (1)


Вот что я думаю, но ответы довольно очевидны:

  • Firefox будет отправлять постоянные файлы cookie, но не сеансовые файлы cookie из старых сеансов.
  • Да, теоретически возможно удалить постоянные файлы cookie браузера.
  • Да, это позволит избежать этих проблем, если вы используете механизацию

Лично я много раз чистил Amazon с помощью механизации. Они предпочли бы, чтобы вы использовали API, но иногда есть что-то, что вы просто не можете получить таким образом.

person pguardiario    schedule 09.02.2012