#java #sparql
#java #sparql
Вопрос:
Я использую этот запрос, чтобы получить все языки программирования и их детали. Это мой тестовый класс. Я использовал его в java, и он отлично работает. Проблема, с которой я сталкиваюсь, заключается в том, что существует язык с именем «ML (язык программирования)»
Он печатает несколько раз с разными аннотациями, с разным влиянием. Не только ML, но и некоторые другие языки делают это. Я не знаю, есть ли какая-либо проблема в моем запросе или он получает точные данные как есть.
package io.naztech.dbpedia;
import java.io.ByteArrayOutputStream;
import java.util.List;
import org.apache.jena.query.ResultSet;
import org.apache.jena.query.ResultSetFormatter;
import org.apache.jena.sparql.engine.http.QueryEngineHTTP;
import org.junit.BeforeClass;
import org.junit.Test;
import io.naztech.talent.model.PediaTag;
public class testDataFetching {
@Test
public void testAllDataFetching() {
String q = "PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> n"
"PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> n"
"PREFIX dbo: <http://dbpedia.org/ontology/> n"
"PREFIX dbp: <http://dbpedia.org/property/> n"
"PREFIX owl: <http://www.w3.org/2002/07/owl#> n"
"PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> n"
"PREFIX foaf: <http://xmlns.com/foaf/0.1/> n"
"PREFIX dc: <http://purl.org/dc/elements/1.1/> n"
"PREFIX : <http://dbpedia.org/resource/> n"
"PREFIX dbpedia2: <http://dbpedia.org/property/> n"
"PREFIX dbpedia: <http://dbpedia.org/> n"
"PREFIX skos: <http://www.w3.org/2004/02/skos/core#> n"
"SELECT DISTINCT ?pl ?pl_label ?abstract ?_thumbnail n"
"( Group_concat ( DISTINCT ?_influenced_label; separator= ", ") AS ?influenced ) n"
"( Group_concat ( DISTINCT ?_influencedBy_label; separator= ", ") AS ?influencedBy ) n"
"( group_concat ( DISTINCT ?_sameAs; separator=", " ) AS ?sameAs ) n"
"( group_concat ( DISTINCT ?_paradigm_label; separator=", " ) AS ?paradigm ) n"
"WHERE {n"
" ?pl rdf:type dbo:ProgrammingLanguage .n"
" OPTIONAL { ?pl dbo:abstract ?abstract .n"
" FILTER ( LANG ( ?abstract ) = 'en' ) . } n"
" ?pl rdfs:label ?pl_label .n"
" FILTER ( LANG ( ?pl_label ) = 'en' ) .n"
" OPTIONAL { ?pl dbo:influenced ?_influenced . n"
" ?_influenced rdfs:label ?_influenced_label . n"
" FILTER ( LANG ( ?_influenced_label ) = 'en' ) . } n"
" OPTIONAL { ?pl dbo:influencedBy ?_influencedBy . n"
" ?_influencedBy rdfs:label ?_influencedBy_label . n"
" FILTER ( LANG ( ?_influencedBy_label ) = 'en' ) . } n"
" OPTIONAL { ?pl owl:sameAs ?_sameAs . } n"
" OPTIONAL { ?pl dbp:paradigm ?_paradigm . n"
" ?_paradigm rdfs:label ?_paradigm_label . } n"
" OPTIONAL { ?pl dbo:thumbnail ?_thumbnail . } n"
" }"
" GROUP BY ?pl ?pl_label ?abstract ?_thumbnail ?influenced ?influencedBy ?sameAs ?paradigm";
@SuppressWarnings("resource")
QueryEngineHTTP queryEngine = new QueryEngineHTTP("http://live.dbpedia.org/sparql", q);
ResultSet results = queryEngine.execSelect();
int count = 0;
while (results.hasNext())
{
QuerySolution qs = results.next();
System.out.println("NAME-->n" qs.get("pl_label").toString() "n");
if(qs.get("influenced") != null)
{
System.out.println("INFLUENCED-->n" qs.get("influenced").toString() "n");
}
if(qs.get("influencedBy") != null)
{
System.out.println("INFLUENCED BY-->n" qs.get("influencedBy").toString() "n");
}
if(qs.get("abstract") != null)
{
System.out.println("ABSTRACT-->n" qs.get("abstract").toString() "n");
}
if(qs.get("sameAs") != null)
{
System.out.println("SAME AS-->n" qs.get("sameAs").toString() "n");
}
if(qs.get("paradigm") != null)
{
System.out.println("PARADIGM-->n" qs.get("paradigm").toString() "n");
}
if(qs.get("_thumbnail") != null)
{
System.out.println("THUMBNAIL-->n" qs.get("_thumbnail").toString() "n");
}
System.out.println("n");
count ;
}
System.out.println(count);
}
}
Комментарии:
1. Есть 3 аннотации на английском языке, посмотрите на live.dbpedia.org/page/ML_ (programming_language)
Ответ №1:
В наборе данных есть 3 аннотации на английском языке, посмотрите на живой ресурс DBpedia.
Вы можете обойти это, удалив ?abstract
переменную из group by ...
части и вместо этого используя агрегатную функцию ( sample, min, max
) для получения любых аннотаций:
SELECT ?pl ?pl_label
(MIN(?_abstract) AS ?abstract) # <- used MIN here to ensure stable result
?_thumbnail
(GROUP_CONCAT(DISTINCT ?_influenced_label ; separator='; ') AS ?influenced)
(GROUP_CONCAT(DISTINCT ?_influencedBy_label ; separator='; ') AS ?influencedBy)
(GROUP_CONCAT(DISTINCT ?_sameAs ; separator=', ') AS ?sameAs)
(GROUP_CONCAT(DISTINCT ?_paradigm_label ; separator=', ') AS ?paradigm)
WHERE
{ ?pl a dbo:ProgrammingLanguage ;
rdfs:label ?pl_label
FILTER ( lang(?pl_label) = "en" )
OPTIONAL
{ ?pl dbo:abstract ?_abstract
FILTER ( lang(?_abstract) = "en" )
}
OPTIONAL
{ ?pl dbo:influenced/rdfs:label ?_influenced_label
FILTER ( lang(?_influenced_label) = "en" )
}
OPTIONAL
{ ?pl dbo:influencedBy/rdfs:label ?_influencedBy_label
FILTER ( lang(?_influencedBy_label) = "en" )
}
OPTIONAL
{ ?pl owl:sameAs ?_sameAs }
OPTIONAL
{ ?pl dbp:paradigm/rdfs:label ?_paradigm_label
FILTER ( lang(?_paradigm_label) = "en" )
}
OPTIONAL
{ ?pl dbo:thumbnail ?_thumbnail }
}
GROUP BY ?pl ?pl_label ?_thumbnail
Обновить
Я добавлю сюда комментарий от @TallTed, он один из людей, стоящих за Virtuoso, и знает это лучше меня:
Имейте в виду, что, хотя рекомендуемые агрегатные функции (
MIN
,MAX
SAMPLE
) получат значение предиката, нет гарантии, что это значение будет последним, введенным в набор данных.
Комментарии:
1. Имейте в виду, что, хотя рекомендуемые агрегатные функции (
MIN
,MAX
SAMPLE
) получат значение предиката, нет гарантии, что это значение будет последним, введенным в набор данных.2. Получение 405 HttpException при применении этого
3. Это работает, только если я получаю данные от dbpedia.org/sparql но это не работает для live.dbpedia.org/sparql но мне нужно использовать конечную точку LIVE, потому что без использования live это дает мне результаты, которые не являются языком программирования, таким как: sex_education, который не является языком программирования. Поэтому мне нужно использовать live.
4. Но это проблема не моего ответа / запроса, а конечной точки. Прямо сейчас конечная точка DBpedia Live не работает: a
HTTP 405
и сообщение «Веб-сайт, к которому вы в данный момент пытаетесь получить доступ, в настоящее время находится на обслуживании. Мы приносим извинения за любые неудобства, которые это вызвало.» возвращается любым запросом. Вы также можете проверить это в веб-интерфейсе.5. Я имел в виду, что без использования Min мой запрос работает для живой конечной точки, но когда я использую Min, я получаю ошибку 405 для Live. Это происходит потому, что сайт находится на обслуживании? Я только что протестировал, он работает в режиме реального времени без использования минимальной агрегатной функции!