Защо има разлики в броя на връзките, свързани с една и съща собственост?

Забелязах, че има различен брой тройки, използващи едно и също свойство (напр. isbn) за книга, но идващи от различни източници. Например,

Общо http://dbpedia.org/property/isbn връзки са 20885, докато
Общо http://dbpedia.org/ontology/isbn връзките са 21132.

Защо тези числа се различават? Искам да знам кой е подходящ за получаване на добра информация.


person user2398267    schedule 07.06.2013    source източник


Отговори (1)


Въпреки че имат подобни имена и представляват приблизително еднаква информация, свойствата не са еднакви. Единият е „http//dbpedia.org/property/isbn“, а другият е „http//dbpedia.org/ontology/isbn“.

Раздел 4.3 Данни от инфокутия от уикито на DBpedia казва, че свойствата от пространството на имената http://dbpedia.org/property/ съдържат необработени данни от информационната кутия и се използват в по-стария Infobox Dataset:

Извлечената информация се представя с помощта на свойства в пространството от имена http://dbpedia.org/property/. Имената на тези свойства директно отразяват името на свойството на информационната кутия на Wikipedia. Имената на свойствата не се почистват или обединяват. Типовете свойства не са част от йерархия на субсумпция и няма последователна онтология за набора от данни в информационната кутия.

Той също така казва, че по-новата Infobox Ontology използва свойства в пространството от имена http://dbpedia.org/ontology/:

Свойствата са представени с помощта на свойства, следващи http://dbpedia.org/ontology/{propertyname} схемата за именуване.

Докато Infobox Ontology не съдържа толкова много информация, колкото Infobox Dataset, информацията е много по-чиста:

Следователно, данните за екземпляра в онтологията на инфокутията са много по-чисти и по-добре структурирани от набора от данни на Infobox, но в момента не покриват всички типове инфокусии и свойства на инфокутията в Wikipedia.

В този случай обаче изглежда, че има повече тройки, използващи свойството онтология, отколкото свойството набор от данни, така че трябва да получите по-чисти, по-последователни данни, използвайки http://dbpedia.org/ontology/isbn вместо http://dbpedia.org/property/isbn.

person Joshua Taylor    schedule 09.06.2013