Я пытаюсь сделать простую функцию, в которой пользователь может указать термин, а программа извлекает для него определение и возвращает его. Лучшая система определения, которую я знаю, - это ключевое слово Google «define» в поисковых запросах, где, если вы начинаете запрос с «define» или «define:» и т. д., он возвращает очень точные и достаточные определения. Однако я понятия не имею, как получить доступ к этой информации программно.
Новый API системы пользовательского поиска Google не показывает определения, а старый дает немного лучшие результаты, но устарел и по-прежнему не показывает те же определения, которые я вижу, когда я ищу термин в браузере.
Потерпев неудачу с Google, я обратился к Википедии, у которой есть огромный API, но я все еще не мог найти способ извлекать резюме, такие как определения Google.
Итак, мой вопрос: кто-нибудь знает, как я могу получить эту информацию из Google через API или любым другим способом?
Это старый вопрос, но он задает одно и то же. За исключением того, что данные ответы больше не применимы, поскольку словарь Google больше не существует.
Обновление: теперь я иду по пути, пытаясь извлечь определения прямо из сама страница. Теперь проблема в том, что когда я посещаю страницу в браузере (Firefox), определения отображаются, но когда я очищаю их с помощью cheerio, они нигде не отображаются на странице. Я должен упомянуть, что я очищаю страницу через nitrous.io, поэтому она отображает страницу из другого региона и работает system к той, с которой я просматриваю ее в браузере, так что, возможно, это связано с регионом. Буду изучать его дальше.
Обновление 2.0: я думаю, что, возможно, определения загружаются асинхронно, и поэтому я понятия не имею, как их очистить, потому что я никогда раньше не занимался очисткой, а я просто новичок :(
Обновление 3.0: Хорошо, теперь я думаю, что это связано не с асинхронной загрузкой, а с визуализатором страницы. Когда я загружаю это в Firefox, страница выглядит так:
Однако, когда я загружаю его в IE (8), это выглядит так:
У кого-нибудь есть понимание этого?