Попытка контролировать порядок применения фильтров токенов в ElasticSearch.
Из документов я знаю, что сначала применяется токенизатор, затем фильтры токенов, но в них не упоминается, как определяется порядок фильтров токенов.
Вот фрагмент YAML из моего скрипта настройки анализа:
KeywordNameIndexAnalyzer :
type : custom
tokenizer : whitespace
filter : [my_word_concatenator, keyword_ngram]
Я бы подумал, что my_word_concatenator
будет применяться перед keyword_ngram
, но похоже, что это не так. Кто-нибудь знает, как (или если) порядок этих фильтров можно контролировать?
Большое спасибо!