Я пытаюсь использовать dbpedia Spotlight для обнаружения специальных терминов (которые не включены в dbpedia), используя в качестве входных данных локальный дамп mediawiki вместо индекса по умолчанию и spotter.dict. Любые идеи будут так оценены
Использование dbpedia Spotlight с локальной медиавики (не экземпляром википедии)
comment
Я попытался локально смоделировать то, что dbpedia делает с википедией, но на этапе я остановил это из-за недостатка аппаратных ресурсов. Я буду очень признателен, если у вас есть какие-либо идеи о том, как я могу создать index и spot.dict из mediawiki для использования в центре внимания dbpedia.
- person mOgaio   schedule 14.05.2013
comment
На вики DBpedia Spotlight есть много инструкций. Как далеко вы продвинулись в установке и настройке всего?
- person Joshua Taylor   schedule 24.06.2013
Ответы (1)
DBpedia Spotlight требует 5 (пять) файлов для построения индекса следующим образом:
Формат N Triples:
- Типы экземпляров: список URL-адресов и их типов (DBpedia, Freebase и т. д.)
E.g:
<YOUR_LINK> <www.w3.org/1999/02/22-rdf-syntax-ns#type> <DBpedia:Type> .
- Ярлыки: список URL-адресов и ярлыков
E.g:
<YOUR_LINK> <www.w3.org/2000/01/rdf-schema#label> "Label"@en .
- Перенаправления: список URL-адресов и их страниц перенаправления.
E.g:
<YOUR_LINK> <dbpedia.org/ontology/wikiPageRedirects> <YOUR_LINK> .
Список значений URL-адресов и страниц с их значениями неоднозначности
.
XML дамп:
- Дамп Вики - (как Дамп Википедии).
После подготовки этих файлов с вашими собственными данными «просто» следуйте руководству по интернационализации, доступному в вики DBpedia Spotlight, чтобы создать индекс с вашими собственными данными.
Всего наилучшего,
person
Sandro Athaide
schedule
15.08.2013