Индексирование Tika и Solr Drupal 7 в Cron

Используя модуль Drupal/Search API/Solr/Tika, мы пытаемся проиндексировать большое количество файлов.

Я настроил индекс, и все работает нормально, пока я не включу модуль вложений API поиска.

Когда мы запускаем cron, tika не вызывается. Мы знаем это, потому что вставили фрагмент PHP-кода для записи в системный журнал в конце модуля tika, и это сообщение никогда не появляется. Он появляется при запуске индекса вручную.

Кроме того, количество индексов элементов не увеличивается после запуска cron.

Мы также заметили, что если мы запустим tika из командной строки, мы получим следующую ошибку в верхней части вывода: INFO - неподдерживаемая/отключенная операция: EI

Индекс работает, как и ожидалось, без установки флажка для индексации вложений как в cron, так и вручную.

Есть идеи, в чем может быть проблема?

Спасибо!

Сайт построен на:

  • Друпал 7

Модули в вопросе:

  • API поиска
  • Вложения API поиска

Индексация с помощью:

  • Апач Солр

Индексирование вложений с помощью:

  • Библиотека Тика

person Corey Condardo    schedule 25.09.2012    source источник


Ответы (1)


У меня точно такая же проблема. Но это не кажется проблемой, потому что документ все равно индексируется.

Я предполагаю, что это проблема Tika, потому что некоторые документы (pdf) работают хорошо, а другие нет. Возможно, это зависит от версии pdf. Попробуйте что-нибудь более простое. т.е. Я написал образец текста и использовал функцию печати в PDF на своем Mac, чтобы получить простой документ в формате PDF. Или используйте документ Word. Нам также пришлось применить исправление реального пути, чтобы заставить Tika работать с файлами... и < модуль href="http://drupal.org/project/transliteration" rel="nofollow">транслитерации, чтобы иметь чистые имена файлов. Для отладки search_api я использую функцию dd() из devel. В search_api_solr/includes/solr_httptransport.inc executeHttpRequest() я вызываю dd($url); dd($options); прямо перед $response = drupal_http_request($url, $options); (строка: 92)... надеюсь, это поможет.

person LarS    schedule 27.09.2012