#jena #turtle-rdf
#jena #turtle-rdf
Вопрос:
Привет, ребята, я пытаюсь загрузить данные с помощью ассемблера TDB2
@prefix cq: <http://www.example.co.uk/hya>
@prefix tdb: <http://jena.apache.org/2016/tdb#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix ja: <http://jena.hpl.hp.com/2005/11/Assembler#> .
@prefix text: <http://jena.apache.org/text#>
@prefix lm: <http://jena.hpl.hp.com/2004/08/location-mapping#>
@prefix dc: <http://purl.org/dc/elements/1.1/>
[] ja:loadClass "org.apache.jena.tdb2.TDB2" .
tdb:DatasetTDB2 rdfs:subClassOf ja:RDFDataset .
tdb:GraphTDB2 rdfs:subClassOf ja:Model .
<#dataset> rdf:type tdb:DatasetTDB2 ;
tdb:location "DB" ;
tdb:unionDefaultGraph true ;
.
<#data1> rdf:type tdb:GraphTDB ;
tdb:dataset <#dataset> ;
tdb:graphName <http://www.example.co.uk/hya/qdata> ;
ja:content [ja:externalContent <file:////Volumes/data/project/src/test/resources/metadata.ttl>;];
.
который не работает, когда я пытаюсь собрать набор данных
Dataset dataset = TDB2Factory.assembleDataset("/Volumes/data/project/src/main/resources/tdb/tdb-assembler.ttl");
if(dataset ==null) {
log.debug("failed");
}else {
1. Model model = dataset.getUnionModel();
2. Model model = dataset.getNamedModel("<dataset>");
3. Model model = dataset.getDefaultModel();
dataset.begin(ReadWrite.WRITE);
model.write(System.out, Lang.TTL.getName());
}
Я безуспешно пытался распечатать модель 3 разными способами.
Может ли кто-нибудь предложить наилучший способ решения этой проблемы, и если есть какая-либо справочная документация по TDB2.
В идеале я хотел бы настроить его позже следующим образом
:indexed-dataset
rdf:type text:TextDataset ;
text:dataset <#dataset> ;
text:index <#indexLuceneText> ;
.
# Text index description
<#indexLuceneText> a text:TextIndexLucene ;
text:directory <file:TDB/LUCENE> ;
text:entityMap <#entMap> ;
text:storeValues true ;
text:analyzer [ a text:StandardAnalyzer ] ;
text:queryAnalyzer [ a text:KeywordAnalyzer ] ;
text:queryParser text:AnalyzingQueryParser ;
text:multilingualSupport true ;
.
<#entMap> a text:EntityMap ;
в соответствии со схемой ассемблера
«каждая модель может иметь некоторый контент, указанный объектом содержимого».
ja:content a rdf:Property
; rdfs:label "Assembler.content"
; rdfs:comment
"""specifies that the subject Loadable is to be loaded with
all the contents specified by the object Content.
"""
; rdfs:domain ja:Loadable
; rdfs:range ja:Content
.
Ответ №1:
Постоянные базы данных (TDB1, TDB2) не обрабатываются ja:content
, поскольку это директива для загрузки данных каждый раз в модель памяти.
Вместо этого предварительно загрузите данные с помощью TDB bulkloader.
Для текстового идентификатора idnex загрузите индекс с textindexer
помощью команды.
Комментарии:
1. Вы меня смутили, для чего это тогда ja:content [ja:externalContent <file:////Volumes/data/project/src/test/resources/metadata.ttl>;]; Извините, если я тупой. Я думаю, что я понял это неправильно. Пожалуйста, поправьте меня или укажите на документацию, которая объясняет это для людей
2. ja: содержимое применяется к моделям в памяти, а не к постоянным базам данных. «Загружаемые» — это вещи, которые загружаются при каждом запуске.