Моят индекс ElasticSearch не индексира правилно и не прави заявки за знаци, които не са буквено-цифрови. По-конкретно точките и тиретата създават проблеми.
Ако индексирам документ с името „O.K. Corral“, той трябва да съответства на заявки за „OK Corral“. По същия начин, ако индексирам „Whiskey A Go-Go“, бих искал да съответства на „Whiskey A GoGo“ и „Whiskey A Go Go“.
В момента само заявки с правилните точки и тирета ще върнат тези документи.
Надявам се, че решението ще разреши и всички потенциални проблеми с други небуквено-цифрови знаци, като запетаи и апостроф.
Звучи като работа за филтри за токени ElasticSearch, но не успях да намеря такъв, който да прави това, което търся. Освен това бих искал да направя това в рамките на ElasticSearch -- не искам да пиша персонализирани манипулации на низове за нормализиране на данните, преди да стигнат до моя ES индекс.
Благодаря за вашата помощ!