如何防止三元组在以编程方式上传到Dydra时混淆？

#Querying the triplestore to retrieve all results sesameSparqlEndpoint = 'http://my.ip.ad.here:8080/openrdf-sesame/repositories/rep_name' sparql = SPARQLWrapper(sesameSparqlEndpoint) queryStringDownload = 'SELECT * WHERE {?s ?p ?o}' dataGraph = Graph() sparql.setQuery(queryStringDownload) sparql.method = 'GET' sparql.setReturnFormat(JSON) output = sparql.query().convert() print output for i in range(len(output['results']['bindings'])): #The encoding is necessary to parse non-English characters output['results']['bindings'][i]['s']['value'].encode('utf-8') try: subject_extract = output['results']['bindings'][i]['s']['value'] if 'http' in subject_extract: subject = "<" + subject_extract + ">" subject_url = URIRef(subject) print subject_url predicate_extract = output['results']['bindings'][i]['p']['value'] if 'http' in predicate_extract: predicate = "<" + predicate_extract + ">" predicate_url = URIRef(predicate) print predicate_url objec_extract = output['results']['bindings'][i]['o']['value'] if 'http' in objec_extract: objec = "<" + objec_extract + ">" objec_url = URIRef(objec) print objec_url else: objec = objec_extract objec_wip = '"' + objec + '"' objec_url = URIRef(objec_wip) # Loading the data on a graph dataGraph.add((subject_url,predicate_url,objec_url)) except UnicodeError as error: print error #Print all statements in dataGraph for stmt in dataGraph: pprint.pprint(stmt) # Upload to Dydra URL = 'http://dydra.com/login' key = 'my_key' with requests.Session() as s: resp = s.get(URL) soup = BeautifulSoup(resp.text,"html5lib") csrfToken = soup.find('meta',{'name':'csrf-token'}).get('content') # print csrf_token payload = { 'account[login]':key, 'account[password]':'', 'csrfmiddlewaretoken':csrfToken, 'next':'/' } # print payload p = s.post(URL,data=payload, headers=dict(Referer=URL)) # print p.text r = s.get('http://dydra.com/username/rep_name/sparql') # print r.text dydraSparqlEndpoint = 'http://dydra.com/username/rep_name/sparql' for stmt in dataGraph: queryStringUpload = 'INSERT DATA {%s %s %s}' % stmt sparql = SPARQLWrapper(dydraSparqlEndpoint) sparql.setCredentials(key,key) sparql.setQuery(queryStringUpload) sparql.method = 'POST' sparql.query()

2条回答

网友

1楼 · 编辑于 2024-09-28 05:17:47

复制数据的一种简单得多的方法（除了使用CONSTRUCT查询而不是SELECT，就像我在注释中提到的那样）就是让Dydra本身直接访问您的Sesame端点，例如通过SERVICE子句。你知道吗

在您的Dydra数据库上执行以下操作（一段时间后，取决于您的Sesame数据库有多大），所有内容都将被复制：

   INSERT { ?s ?p ?o }
   WHERE { 
      SERVICE <http://my.ip.ad.here:8080/openrdf-sesame/repositories/rep_name> 
      { ?s ?p ?o }
   }

如果上述方法在Dydra上不起作用，您也可以使用URI http://my.ip.ad.here:8080/openrdf-sesame/repositories/rep_name/statements直接从Sesame存储访问RDF语句。假设Dydra有一个upload特性，您可以提供RDF文档的URL，您只需向它提供上面的URI，它就应该能够加载它。你知道吗

网友

2楼 · 编辑于 2024-09-28 05:17:47

如果进行以下更改，则上述代码可以工作：

使用构造查询而不是选择。此处显示详细信息->；How to iterate over CONSTRUCT output from rdflib?
使用密钥作为帐户[登录]和帐户[密码]的输入

然而，这可能不是最有效的方法。首先，为每个三元组单独插入不是一个好方法。Dydra并不是以这种方式记录所有语句（我只插入了大约30%的三元组）。相反，使用Jeen建议的http://my.ip.ad.here:8080/openrdf-sesame/repositories/rep_name/statements方法使我能够成功地移植所有数据。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章