Watir-webdriver срещу Mechanize за избягване на evercookies\zombiecookies на Amazon

Работя върху начин за автоматично качване \ управление на неща в платформата Amazon kindle на множество акаунти.

Някой, който има богат опит с amazon, ми каза, че Amazon използва известен вид постоянна бисквитка (която Предполагам, че беше основа за няколко съдебни дела). Те могат да се съхраняват във флаш, като генериран .png, който след това е принуден да бъде кеширан и произволен брой неща; вижте връзката. Притеснявам се за това.

В момента всички скриптове, които използвам за управление на качванията, са написани на Ruby и използват малко бъгове, но въпреки това доста чист watir-webdriver. Доколкото разбирам, всеки екземпляр на Firefox, управляван от watir-webdriver, е свой собствен уникален екземпляр без бисквитки. Но може ли Firefox все още да предава данни от тези бисквитки evercookies на Amazon чрез флаш памет или по много хитри начини? Наистина не съм сигурен.

Въпросите ми са:

а) Какво изчиства watir-webdriver преди стартиране на нова „сесия“ на браузър, различен от http бисквитките?

б) На теория, ако открия всички места, където Amazon оставя тези бисквитки, мога ли да ги изчистя ръчно всеки път, преди да стартирам екземпляра на браузър?

в) Ако пренапиша скриптовете с помощта на Mechanize, а не на watir-webdriver, ще избегна ли това ВСИЧКИ тези проблеми, тъй като mechanize (afaik) напълно не може да изпълнява javascript код?

Бихте ли препоръчали използването на mechanize, за да избегнете тези бисквитки?


person dsp_099    schedule 09.02.2012    source източник


Отговори (1)


Ето какво мисля аз, но отговорите са доста очевидни:

  • Firefox ще изпрати постоянни бисквитки, но не и сесийни бисквитки от стари сесии
  • Да, теоретично е възможно да изтриете постоянните бисквитки на браузъра.
  • Да, ще избегнете тези проблеми, ако използвате механизация

Лично аз съм изстъргвал Amazon с mechanize много пъти. Те биха предпочели да използвате API, но понякога има нещо, което просто не можете да получите по този начин.

person pguardiario    schedule 09.02.2012