Използваме ES за индексиране на ~1,5 милиона записа от базата данни. За да попълним индекса, използваме компонент Pentaho ES, който е настроен на „Презаписване, ако съществува“ (работи ~15 минути). Освен това отделни индексирани документи могат да бъдат извлечени, актуализирани или изтрити чрез Java услуги.
Въпросът е какво ще върне ES по време на пълната актуализация на Pentaho? Например, имаме 1,5 милиона индексирани документа с версия = 1. Следващата актуализация ще промени тази версия на 2. Ако поискаме документ, докато Pentaho го актуализира – ще получим ли старата му версия? Ще бъде ли недостъпна услугата за този конкретен документ? Освен това, ако получим стара версия, новата версия ще бъде ли налична веднага след актуализацията или ще изчака, докато се актуализира пълната партида (компонентът pentaho изпраща редове на партиди от 5k)?
Пентахо - 4.4
ElasticSearch - 0.19.4
Lucene - 3.6.0