Как запросить дампы файлов DBpedia?

Как я могу получить информацию об объектах из дампов данных DBpedia с помощью Python?

Большинство сообщений в настоящее время в stackoverflow работают с конечной точкой, а не с файлом дампа данных (например, https://datascience.stackexchange.com/questions/4873/querying-dbpedia-from-python), используя Интерфейс SPARQL Endpoint для Python

Одна реализация scikit-learn для работы с ним просто повторяет это и помещает их в словарь

Например, если вы хотите узнать о знаменитостях, родившихся в определенную дату, просто из свойств дампы данных информационного окна.

Я попытался сделать то же самое, используя интерфейс конечной точки SPARQL, но, очевидно, это не сработало с дампом данных.


person TJain    schedule 26.02.2017    source источник
comment
Зачем вам работать с дампами данных, когда доступна общедоступная конечная точка SPARQL? - Могут быть причины, по которым вы хотите это сделать, и было бы хорошо их понять [прежде чем отвечать].   -  person CaptSolo    schedule 28.02.2017


Ответы (1)


Обычно вы загружаете эти данные в хранилище RDF (установите его, если у вас его еще нет) и запрашиваете их с помощью SPARQL.

Сделав это, вы создадите локальное зеркало DBPedia. Учитывая, что DBPedia уже предоставляет конечную точку SPARQL, есть ли какая-то причина, по которой вы не можете просто использовать ее?

В этом ответе StackOverflow упоминаются варианты настройки локального зеркала DBPedia: Почему результат dbpedia не соответствует

Ничто из этого не относится к Python — SPARQL — это стандартный язык запросов для данных RDF.

В качестве альтернативы вы можете перебирать файл в поисках необходимой информации на лету. Таким образом, вы теряете гибкость («запрос» — это ваш код), но можете сэкономить на использовании памяти.

person CaptSolo    schedule 28.02.2017
comment
Спасибо за ваш вклад, знаете ли вы, где можно найти более конкретную конечную точку, например, для определенного набора данных, такого как дамп? - person TJain; 28.02.2017
comment
Вам не понадобится более конкретная конечная точка — стандартная конечная точка (например, live.dbpedia.org/sparql ) содержит данные из нескольких файлов данных DBPedia, включая упомянутый вами набор данных информационного поля. - person CaptSolo; 01.03.2017