набор данных dbpedia Spotlight

В продолжение набора данных dbpedia Spotlight я выполнил инструкции по обновлению своего набора данных, но получил следующую ошибку:

INFO 2012-06-19 11:58:04,300 main [MergedOccurrencesContextSearcher] - Using index at: org.apache.lucene.store.MMapDirectory@/home/user_name/new/spotlight/index lockFactory=org.apache.lucene.store.NativeFSLockFactory@671381e7
Exception in thread "main" java.io.FileNotFoundException: /home/user_name/new/spotlight/index/segments_bp (No such file or directory)
    at java.io.RandomAccessFile.open(Native Method)
    at java.io.RandomAccessFile.<init>(RandomAccessFile.java:233)
    at org.apache.lucene.store.MMapDirectory.openInput(MMapDirectory.java:219)
    at org.apache.lucene.store.FSDirectory.openInput(FSDirectory.java:345)
    at org.apache.lucene.index.SegmentInfos.read(SegmentInfos.java:265)
    at org.apache.lucene.index.DirectoryReader$1.doBody(DirectoryReader.java:76)
    at org.apache.lucene.index.SegmentInfos$FindSegmentsFile.run(SegmentInfos.java:709)
    at org.apache.lucene.index.DirectoryReader.open(DirectoryReader.java:72)
    at org.apache.lucene.index.IndexReader.open(IndexReader.java:273)
    at org.dbpedia.spotlight.lucene.search.BaseSearcher.<init>(BaseSearcher.java:67)
    at org.dbpedia.spotlight.lucene.search.MergedOccurrencesContextSearcher.<init>(MergedOccurrencesContextSearcher.java:64)
    at org.dbpedia.spotlight.model.SpotlightFactory.<init>(SpotlightFactory.scala:71)
    at org.dbpedia.spotlight.web.rest.Server.main(Server.java:86)

Я смог успешно использовать словарь корректировщика, но не мог использовать индексные файлы.

Не могли бы вы мне помочь?


person learner    schedule 19.06.2012    source источник


Ответы (1)


Трудно помочь вам без достаточной информации. Сообщение жалуется, что файла нет. Файл есть? Каталог есть?

Пожалуйста, вставьте результат команды ls -lah /home/user_name/new/spotlight/index

person Pablo Mendes    schedule 20.06.2012
comment
извините за боль. Я нашел ответ на свою проблему. Была проблема с распаковкой файлов по отдельности, которую я использовал ранее. В остальном ваши указания мне очень помогли. Кстати, я прочитал статью и увидел настраиваемую реализацию Spotlight, и мне было интересно настроить ее для текста в социальных сетях. Можете ли вы помочь мне, как и с чего мне начать редактирование и изменение кодов для достижения моей цели. - person learner; 20.06.2012
comment
Текст в социальных сетях короткий и часто не очень тематически сконцентрированный. Это означает, что вы должны использовать как можно больше дополнительной информации, чтобы помочь алгоритму. Но, что более важно, нам нужно знать, какие вещи вы хотите извлечь из этого текста: темы, людей, места, что? Лучше всего обсудить это в нашем списке dbp-spotlight-users. . - person Pablo Mendes; 28.06.2012