Для такой фразы, как «БЫСТРАЯ КОРИЧНЕВАЯ ЛИСА», я хочу удалить слово «THE» в начале, чтобы оно отображалось как «БЫСТРАЯ КОРИЧНЕВАЯ ЛИСА».
Я пробовал следующие настройки в schema.xml, и ни одна из них не сработала. В итоге происходит удаление слова «THE», даже если его нет в начале фразы.
т.е. "БЫСТРЫЙ И МЕРТВЫЙ" превращается в "БЫСТРЫЙ И МЕРТВЫЙ"
"solr.PatternReplaceFilterFactory" pattern="(the )" replace="" replace="all"/>
"solr.PatternReplaceFilterFactory" pattern="(\s)" replace="" replace="all"/>
"solr.PatternReplaceFilterFactory" pattern="(\s)" replace="" replace="all"/>
Я использую KeywordTokenizerFactory, потому что я делаю точное совпадение.
Цель состоит в том, чтобы отправить Solr следующую фразу для индексации:
"THE QUICK BROWN FOX", слово "THE" будет опущено только в начале фразы и трансформируется в solr в "QUICK BROWN FOX".
Любые идеи будут высоко оценены. Спасибо.