Получение ссылки на документ, содержащий микроданные, из которых получены конкретные знания RDF

#html #rdf #microdata #rdfa

#HTML #rdf #микроданные #rdfa

Вопрос:

Я извлекаю микроданные из HTML-страниц и преобразую их в знания в виде троек RDF. Теперь я хотел бы получить обратную ссылку из знаний RDF на HTML-документ, откуда он взят.

Существует ли какой-либо установленный способ аннотирования исходного документа к знаниям RDF, извлеченным из микроданных HTML?

Если такого не должно быть, может быть, что-то подобное для извлечения RDFa из RDF?

Я представляю себе что-то вроде добавления еще одной тройки к любому предмету, который извлекается из документа, например, следующим образом:

 ?subject microdata:wasExtractedFrom file:abc.html
 

Или даже что-то более конкретное, например:

 ?knowledge rdf:subject ?subject
?knowledge rdf:predicate ?predicate
?knowledge rdf:object ?object
?knowledge microdata:wasExtractedFrom file:abc.html
 

Комментарии:

1. Простое овеществление RDF было бы слишком подробным. RDR менее подробный, но также менее поддерживается и не позволяет «абстрагироваться» от источника. Существуют другие подходы к происхождению Эти люди используют именованные графики .

2. Я все еще новичок в RDF, не могли бы вы немного подробнее объяснить, что они там делают и где я могу увидеть примеры?

3. (s,p,o,g) они используют так называемые квадратики вместо троек с обозначением графика, который в вашем случае может быть файлом HTML. (s,p,o) g Очевидно, что для сериализации таких данных вам нужен какой-то формат quad, такой как N-Quads или Trig

4. Более поздней альтернативой является использование RDF *, хотя это (пока) не является частью стандарта и не поддерживается всеми инструментами, связанными с RDF

5. @UninformedUser Что g означает в этих квадратиках?