Мой индекс ElasticSearch неправильно индексирует и запрашивает не буквенно-цифровые символы. В частности, точки и тире вызывают проблемы.
Если я проиндексирую документ с именем «ОК Коррал», он должен соответствовать запросам «ОК Коррал». Точно так же, если я проиндексирую «Whiskey A Go-Go», я бы хотел, чтобы он соответствовал «Whiskey A GoGo» и «Whiskey A Go Go».
Сейчас только запросы с правильными точками и тире вернут эти документы.
Я надеюсь, что это решение также решит любые потенциальные проблемы с другими небуквенно-цифровыми символами, такими как запятые и апострофы.
Это похоже на работу для фильтров токенов ElasticSearch, но я не смог найти тот, который делает то, что я ищу. Кроме того, я хотел бы сделать это в ElasticSearch — я не хочу писать собственные манипуляции со строками для нормализации данных до того, как они попадут в мой индекс ES.
Спасибо за вашу помощь!