Ассемблер Jena TDB2 загружает данные из файла

#jena #turtle-rdf

#jena #turtle-rdf

Вопрос:

Привет, ребята, я пытаюсь загрузить данные с помощью ассемблера TDB2

 @prefix cq:        <http://www.example.co.uk/hya>
@prefix tdb:       <http://jena.apache.org/2016/tdb#> .
@prefix rdf:       <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs:      <http://www.w3.org/2000/01/rdf-schema#> .
@prefix ja:        <http://jena.hpl.hp.com/2005/11/Assembler#> .
@prefix text:      <http://jena.apache.org/text#>
@prefix lm:        <http://jena.hpl.hp.com/2004/08/location-mapping#>
@prefix dc:        <http://purl.org/dc/elements/1.1/>
 
[] ja:loadClass "org.apache.jena.tdb2.TDB2" .
tdb:DatasetTDB2  rdfs:subClassOf  ja:RDFDataset .
tdb:GraphTDB2    rdfs:subClassOf  ja:Model .

<#dataset> rdf:type         tdb:DatasetTDB2 ;
   tdb:location "DB" ;
   tdb:unionDefaultGraph true ;
   .

<#data1> rdf:type tdb:GraphTDB ;
    tdb:dataset <#dataset> ;
    tdb:graphName <http://www.example.co.uk/hya/qdata> ;
    ja:content [ja:externalContent <file:////Volumes/data/project/src/test/resources/metadata.ttl>;];
    .  
 

который не работает, когда я пытаюсь собрать набор данных

 Dataset dataset = TDB2Factory.assembleDataset("/Volumes/data/project/src/main/resources/tdb/tdb-assembler.ttl");
        if(dataset ==null) {
            log.debug("failed");
        }else {
            

          1. Model model = dataset.getUnionModel();
          2. Model model = dataset.getNamedModel("<dataset>");
          3. Model model = dataset.getDefaultModel();

            dataset.begin(ReadWrite.WRITE);
            model.write(System.out, Lang.TTL.getName());
        }
 

Я безуспешно пытался распечатать модель 3 разными способами.

Может ли кто-нибудь предложить наилучший способ решения этой проблемы, и если есть какая-либо справочная документация по TDB2.

В идеале я хотел бы настроить его позже следующим образом

 :indexed-dataset
    rdf:type     text:TextDataset ;
    text:dataset   <#dataset> ;
    text:index     <#indexLuceneText> ;
    .

# Text index description
<#indexLuceneText> a text:TextIndexLucene ;
    text:directory <file:TDB/LUCENE> ;
    text:entityMap <#entMap> ;
    text:storeValues true ; 
    text:analyzer [ a text:StandardAnalyzer ] ;
    text:queryAnalyzer [ a text:KeywordAnalyzer ] ;
    text:queryParser text:AnalyzingQueryParser ;
    text:multilingualSupport true ;
 .

<#entMap> a text:EntityMap ;

 

в соответствии со схемой ассемблера

«каждая модель может иметь некоторый контент, указанный объектом содержимого».

 ja:content a rdf:Property
    ; rdfs:label "Assembler.content"
    ; rdfs:comment
        """specifies that the subject Loadable is to be loaded with
        all the contents specified by the object Content.
        """
    ; rdfs:domain ja:Loadable
    ; rdfs:range ja:Content
    .
 

Ответ №1:

Постоянные базы данных (TDB1, TDB2) не обрабатываются ja:content , поскольку это директива для загрузки данных каждый раз в модель памяти.

Вместо этого предварительно загрузите данные с помощью TDB bulkloader.

Для текстового идентификатора idnex загрузите индекс с textindexer помощью команды.

https://jena.apache.org/documentation/query/text-query.html

Комментарии:

1. Вы меня смутили, для чего это тогда ja:content [ja:externalContent <file:////Volumes/data/project/src/test/resources/metadata.ttl>;]; Извините, если я тупой. Я думаю, что я понял это неправильно. Пожалуйста, поправьте меня или укажите на документацию, которая объясняет это для людей

2. ja: содержимое применяется к моделям в памяти, а не к постоянным базам данных. «Загружаемые» — это вещи, которые загружаются при каждом запуске.