#html #rdf #microdata #rdfa
#HTML #rdf #микроданные #rdfa
Вопрос:
Я извлекаю микроданные из HTML-страниц и преобразую их в знания в виде троек RDF. Теперь я хотел бы получить обратную ссылку из знаний RDF на HTML-документ, откуда он взят.
Существует ли какой-либо установленный способ аннотирования исходного документа к знаниям RDF, извлеченным из микроданных HTML?
Если такого не должно быть, может быть, что-то подобное для извлечения RDFa из RDF?
Я представляю себе что-то вроде добавления еще одной тройки к любому предмету, который извлекается из документа, например, следующим образом:
?subject microdata:wasExtractedFrom file:abc.html
Или даже что-то более конкретное, например:
?knowledge rdf:subject ?subject
?knowledge rdf:predicate ?predicate
?knowledge rdf:object ?object
?knowledge microdata:wasExtractedFrom file:abc.html
Комментарии:
1. Простое овеществление RDF было бы слишком подробным. RDR менее подробный, но также менее поддерживается и не позволяет «абстрагироваться» от источника. Существуют другие подходы к происхождению … Эти люди используют именованные графики .
2. Я все еще новичок в RDF, не могли бы вы немного подробнее объяснить, что они там делают и где я могу увидеть примеры?
3.
(s,p,o,g)
они используют так называемые квадратики вместо троек с обозначением графика, который в вашем случае может быть файлом HTML.(s,p,o)
g
Очевидно, что для сериализации таких данных вам нужен какой-то формат quad, такой как N-Quads или Trig4. Более поздней альтернативой является использование RDF *, хотя это (пока) не является частью стандарта и не поддерживается всеми инструментами, связанными с RDF
5. @UninformedUser Что
g
означает в этих квадратиках?