Вы должны рассматривать все идентификаторы как эквивалентные. Они бывают /en, /m, /g, /wikipedia/en, /wikipedia/en_id и в большом количестве других форм.
Я подозреваю, что в идеальном мире Google предпочел бы не раскрывать идентификаторы /g, но они имеют тенденцию просачиваться. Они представляют объекты во внутренней сети знаний Google, у которых нет соответствующих внешних идентификаторов/тем. Большинство из них, по моему опыту, представляют вещи из диапазона /notable*, где у Google есть известные темы, которые они создали из множества других источников, отличных от Freebase (например, поисковые запросы, другие лицензированные базы данных и т. д.).
Сущности, представленные идентификаторами /g, на самом деле меньше, чем /type/object, но, вероятно, представлены таким образом в API/загрузках, потому что это ближайший эквивалент «ничего». Их, вероятно, следует рассматривать как голые идентификаторы без типа или другой информации, кроме их метки/имени. Я бы сохранил их, хотя они могут волшебным образом превратиться во что-то полезное в будущем (не предсказание, а просто общая философия, согласно которой следует сохранять как можно больше информации для целей примирения).
person
Tom Morris
schedule
18.06.2014