Я программно взаимодействую с поисковой системой, и мне нужно заставить ее думать, что я человек, делающий запросы, а не робот. Это включает в себя создание запросов, которые кажутся правдоподобными для любого обычного пользователя, например, «расписание футбола ncaa» или «когда была посадка на Луну?» Я буду делать более тысячи таких запросов ежедневно, и поиск случайных слов из словаря не поможет, так как это не очень типичная поисковая привычка.
До сих пор я думал о нескольких способах создания реалистичных запросов:
- Получите список самых популярных поисковых запросов Google (или Yahoo, Bing и т. д.) за день.
- Воспользуйтесь функцией автозаполнения Google, введя случайное слово из словаря, за которым следует пробел, и выберите рекомендуемые запросы.
Последний подход звучит так, как будто он потребует много обратного проектирования. И при первом подходе мне не удалось найти список из более чем 80 или около того запросов — единственными источниками, которые я нашел, являются тренды AOL (50–100) и Тренды Google (30).
Как мне создать большой набор человекоподобных поисковых фраз?
(Для любых ответов, зависящих от языка: я программирую на Python)