Использование dbpedia Spotlight с локальной медиавики (не экземпляром википедии)

Я пытаюсь использовать dbpedia Spotlight для обнаружения специальных терминов (которые не включены в dbpedia), используя в качестве входных данных локальный дамп mediawiki вместо индекса по умолчанию и spotter.dict. Любые идеи будут так оценены


person mOgaio    schedule 13.05.2013    source источник
comment
Я попытался локально смоделировать то, что dbpedia делает с википедией, но на этапе я остановил это из-за недостатка аппаратных ресурсов. Я буду очень признателен, если у вас есть какие-либо идеи о том, как я могу создать index и spot.dict из mediawiki для использования в центре внимания dbpedia.   -  person mOgaio    schedule 14.05.2013
comment
На вики DBpedia Spotlight есть много инструкций. Как далеко вы продвинулись в установке и настройке всего?   -  person Joshua Taylor    schedule 24.06.2013


Ответы (1)


DBpedia Spotlight требует 5 (пять) файлов для построения индекса следующим образом:

Формат N Triples:

  • Типы экземпляров: список URL-адресов и их типов (DBpedia, Freebase и т. д.)

E.g:

   <YOUR_LINK> <www.w3.org/1999/02/22-rdf-syntax-ns#type> <DBpedia:Type> .
  • Ярлыки: список URL-адресов и ярлыков

E.g:

   <YOUR_LINK> <www.w3.org/2000/01/rdf-schema#label> "Label"@en .
  • Перенаправления: список URL-адресов и их страниц перенаправления.

E.g:

   <YOUR_LINK> <dbpedia.org/ontology/wikiPageRedirects> <YOUR_LINK> .
  • Список значений URL-адресов и страниц с их значениями неоднозначности

    .

XML дамп:

  • Дамп Вики - (как Дамп Википедии).

После подготовки этих файлов с вашими собственными данными «просто» следуйте руководству по интернационализации, доступному в вики DBpedia Spotlight, чтобы создать индекс с вашими собственными данными.

Всего наилучшего,

person Sandro Athaide    schedule 15.08.2013