Как ускорить чтение

Я начинаю использовать Apache Jena Fuseki для локального запуска SPARQL.

Я ищу способ ускорить загрузку файла RDF. В настоящее время я использую следующую команду, как указано в инструкции.

s-put http://localhost:3030/ds/data default data.ttl

Поскольку мои данные RDF велики (70 ГБ), я хотел бы ускорить загрузку данных.


person Benben    schedule 04.04.2016    source источник


Ответы (1)


В TDB есть несколько утилит командной строки, которые можно использовать для загрузки данных в хранилище данных. В этом случае вы, вероятно, захотите использовать tdbloader или более эффективный (но менее переносимый) tdbloader2.

tdbloader

Массовый загрузчик и построитель индексов. Выполнение операций массовой загрузки более эффективно, чем просто чтение RDF в модель TDB-back [sic].

tdbloader2

Массовый загрузчик и построитель индексов. Быстрее, чем tdbloader, но работает только в Linux и Mac OS/X, поскольку использует некоторые системные утилиты Unix.

person Joshua Taylor    schedule 05.04.2016
comment
см. wiki.bitplan.com/index.php/ для некоторых тестов производительности с tdbloader2 загружает около 600 ГБ троек WikiData - person Wolfgang Fahl; 13.05.2020