Я надеюсь использовать Solr для выполнения поиска по информации, проанализированной из XML-файлов. Эти XML-файлы не в формате документа Solr, поэтому я должен их проанализировать и таким образом получить нужные мне поля.
Я знаком с программированием на Java, и мне было интересно, будет ли SolrJ более простым методом, чем использование обработчика импорта данных. Я рассматриваю возможность просмотра каждого XML-файла, который у меня есть, и анализа полей, которые мне нужны, из каждого. Есть ли недостатки у одного метода по сравнению с другим? Я полагаю, что, поскольку я знаком с Java, может быть проще анализировать XML таким образом?
Мне, вероятно, понадобится несколько условий и регулярных выражений. Во всяком случае, надежный способ получить мои поля из относительно неструктурированного XML.
Как SolrJ будет работать с интерфейсом? То есть, если я индексирую с помощью SolrJ, могу ли я по-прежнему выполнять свои запросы через интерфейс?