Обновление схемы Solr

Я новичок в Solr, и мне любопытно, какова процедура изменения / обновления схемы?

Я заметил, что могу легко ДОБАВИТЬ новые поля, не вызывая никаких проблем, но каждый раз, когда мне приходилось ОБНОВЛЯТЬ поле, это вызывало проблемы.

Из-за количества данных, загруженных в систему, я не смогу сохранить исходные данные, которые использовались для генерации запросов add / doc для solr, поэтому я не смогу просто повторно проиндексировать все, когда произойдет изменение. .

Например, я хочу изменить существующее поле с типа «строка» на «текст», а тип текстового поля имеет много токенизаторов, фильтров и т. Д., Которые я хотел бы немедленно применить к существующим данным.

В идеале я ищу способ обновить схему, повторно проиндексировать / оптимизировать существующий набор данных и иметь возможность отслеживать, сколько времени потребуется до завершения операции.

Если кто-то может помочь мне понять это, я был бы очень признателен!


person Jason Palmer    schedule 18.05.2011    source источник


Ответы (1)


Придется переиндексировать. Другого выхода нет. Индексирование - это деструктивный процесс по отношению к его вводу: текст нарезанный и нарезанный кубиками, чтобы ускорить поиск, поэтому вы не сможете восстановить исходный текст, если он не находится в сохраненное поле. (сохранено = true в вашем определении поля Solr в schema.xml). Если он у вас был в сохраненном поле, все, что вам нужно сделать, это небольшой процесс перебрать документы и просто повторно отправить их, чтобы они переиндексировались.

person Mauricio Scheffer    schedule 18.05.2011