Идентификаторы пространств имен Freebase /g/ vs /m/

Я пытался читать вики Freebase и т. Д., Но не могу найти ответ на этот, казалось бы, простой вопрос. В чем разница между идентификаторами пространств имен /g/ и /m/? (Я просматривал дамп Freebase RFD, а также онлайн-доступ.)

Например, «Музыкальная запись» имеет идентификатор /g/ 1yg94vctq (http://www.freebase.com/g/1yg94vctq), но есть также идентификатор /m/ 0kpv11 (http://www.freebase.com/m/0kpv11)

Первый — это «объект», а второй — «тип». Какова связь между этими двумя и что означает /g/?


person craighagerman    schedule 17.06.2014    source источник


Ответы (1)


Вы должны рассматривать все идентификаторы как эквивалентные. Они бывают /en, /m, /g, /wikipedia/en, /wikipedia/en_id и в большом количестве других форм.

Я подозреваю, что в идеальном мире Google предпочел бы не раскрывать идентификаторы /g, но они имеют тенденцию просачиваться. Они представляют объекты во внутренней сети знаний Google, у которых нет соответствующих внешних идентификаторов/тем. Большинство из них, по моему опыту, представляют вещи из диапазона /notable*, где у Google есть известные темы, которые они создали из множества других источников, отличных от Freebase (например, поисковые запросы, другие лицензированные базы данных и т. д.).

Сущности, представленные идентификаторами /g, на самом деле меньше, чем /type/object, но, вероятно, представлены таким образом в API/загрузках, потому что это ближайший эквивалент «ничего». Их, вероятно, следует рассматривать как голые идентификаторы без типа или другой информации, кроме их метки/имени. Я бы сохранил их, хотя они могут волшебным образом превратиться во что-то полезное в будущем (не предсказание, а просто общая философия, согласно которой следует сохранять как можно больше информации для целей примирения).

person Tom Morris    schedule 18.06.2014