Взаимодействам с търсачка програмно и трябва да я подмамя да мисли, че съм човек, който прави заявки, а не робот. Това включва генериране на заявки, за които изглежда правдоподобно, че всеки обикновен потребител би търсил, като "ncaa футболен график" или "Кога беше кацането на Луната?" Ще правя над хиляда от тези заявки всеки ден и търсенето на произволни думи от речник няма да се справи, тъй като това не е много типичен навик за търсене.
Досега съм измислил няколко начина за генериране на реалистични заявки:
- Получете списък с най-добрите търсения в Google (или Yahoo или Bing и т.н.) за деня
- Използвайте функцията за автоматично довършване на Google, като въведете произволна дума от речника, последвана от интервал и изтриете препоръчаните заявки.
Последният подход звучи така, сякаш ще включва много обратно инженерство. И с предишния подход не успях да намеря списък с повече от 80 или нещо заявки - единствените източници, които намерих, са AOL тенденции (50-100) и Google Тенденции (30).
Как мога да започна да генерирам голям набор от фрази за търсене, подобни на човека?
(За всякакви отговори, зависещи от езика: програмирам на Python)