Я новичок в ElasticSearch и пытался настроить Elasticsearch для получения нечетких совпадений. При реализации нечеткого поиска, фильтра автозаполнения и черепицы точные совпадения, похоже, имеют более низкий балл, чем частичные совпадения. Например, если запрос - «Кольцо», кажется, что он больше соответствует «Медному кольцу», а не «Кольцу».
Может кто-нибудь мне помочь?
Вот как я делаю индекс:
itemindex = es.indices.create(
index='mo-items-index-1',
body={
"settings": {
"number_of_shards": 1,
"analysis": {
"filter": {
"autocomplete_filter": {
"type": "edge_ngram",
"min_gram": 1,
"max_gram": 20
},
"custom_shingle": {
"type": "shingle",
"min_shingle_size": 2,
"max_shingle_size": 3,
"output_unigrams": True
},
"my_char_filter": {
"type": "pattern_replace",
"pattern": " ",
"replacement": ""
}
},
"analyzer": {
"autocomplete": {
"type": "custom",
"tokenizer": "standard",
"filter": [
"lowercase",
"custom_shingle",
"autocomplete_filter",
"my_char_filter"
]
}
}
}
},
"mappings": {
"my_type": {
"properties": {
"item_id": {
"type": "string",
"analyzer": "autocomplete",
"search_analyzer": "standard"
},
"item_name": {
"type": "string",
"analyzer": "autocomplete",
"search_analyzer": "standard"
}
}
}
}
},
# Will ignore 400 errors, remove to ensure you're prompted
ignore=400
)
Вот как я запрашиваю термин:
res2 = es.search(index="mo-items-index-1", size=200, body={"query": {"multi_match": {
"fields": [
"item_name", "item_id"], "query": userQuery, "fuzziness": "AUTO"}}, "highlight": {
"fields": {
"item_name": {},
"item_id": {}
}
}, })