Количество троек в Jena Fuseki

#jena #semantic-web #fuseki

#jena #семантическая сеть #фузеки

Вопрос:

Мне нужно загрузить 3 миллиарда троек, но максимум, по-видимому, составляет 1,7 миллиарда https://www.w3.org/wiki/LargeTripleStores#Jena_TDB_.281.7B.29

Это правильно? Какое максимальное количество троек я могу загрузить в fuseki?

Ответ №1:

(К вашему сведению: ни одна из этих страниц не обновляется, насколько я вижу.)

в TDB2 возможно 3 миллиарда.

Конкретного жесткого ограничения нет — система просто замедляется. База данных будет очень большой (она зависит от данных, и у меня нет цифр).

Существует несколько загрузчиков для TDB2. Лучший выбор зависит от аппаратного обеспечения.

В следующем выпуске Apache Jena есть один, специально разработанный для больших нагрузок при загрузке на вращающийся диск на скромном оборудовании (называемый в просторечии «xloader»).

Попросите в списке рассылки users @jena поговорить с другими, кто работал с большими наборами данных.

Комментарии:

1. Большое спасибо за ответ

2. см. wiki.bitplan.com/index.php/WikiData_Import_2020-08-15 для импорта примерно в 14 миллиардов утраивается