#jena #semantic-web #fuseki
#jena #семантическая сеть #фузеки
Вопрос:
Мне нужно загрузить 3 миллиарда троек, но максимум, по-видимому, составляет 1,7 миллиарда https://www.w3.org/wiki/LargeTripleStores#Jena_TDB_.281.7B.29
Это правильно? Какое максимальное количество троек я могу загрузить в fuseki?
Ответ №1:
(К вашему сведению: ни одна из этих страниц не обновляется, насколько я вижу.)
в TDB2 возможно 3 миллиарда.
Конкретного жесткого ограничения нет — система просто замедляется. База данных будет очень большой (она зависит от данных, и у меня нет цифр).
Существует несколько загрузчиков для TDB2. Лучший выбор зависит от аппаратного обеспечения.
В следующем выпуске Apache Jena есть один, специально разработанный для больших нагрузок при загрузке на вращающийся диск на скромном оборудовании (называемый в просторечии «xloader»).
Попросите в списке рассылки users @jena поговорить с другими, кто работал с большими наборами данных.
Комментарии:
1. Большое спасибо за ответ
2. см. wiki.bitplan.com/index.php/WikiData_Import_2020-08-15 для импорта примерно в 14 миллиардов утраивается