Javascript實現關聯數據(Linked Data)查詢及注意細節
2024-05-06 14:19:31
供稿:網友
前言
自由百科全書不僅僅應當可以自由編寫,而更應該可以自由獲得。
DBpedia對Wikipedia的數據變成Linked Data形式,使得機器也能讀懂并自由獲得這些數據。
本文的主要目的是利用Javascript從DBpedia中獲取我們想要的數據。
對Linked Data不太了解的請參考:關聯數據入門——RDF。
SPARQL
Trying to use the Semantic Web without SPARQL is like trying to use a relational database without SQL.
—— Tim Berners-Lee
SPARQL是Semantic Web(語義網)的SQL,用于數據查詢的語言。
SPARQL Endpoint
SPARQL查詢終端,是一種HTTP綁定協議,用于通過HTTP進行SPARQL查詢,并返回相應數據。
DBpedia的SPARQL Endpoint地址是:http://dbpedia.org/sparql
大家可以通過瀏覽器打開這個頁面,進行SPARQL查詢(最好翻墻,沒翻墻查詢經常失敗,不太明白為什么= =)。
不過這種查詢最終返回結果是HTML頁面,并不是我們想要的,我們可以通過設置Request Header的Accept屬性來指定返回數據類型。
例如如果指定為:text/xml,那么返回的便是RDF格式數據。
那么我們如何輸入SPARQL查詢代碼呢?
只需通過get或者post方法用參數query,將代碼傳過去。例如:
如果想查詢:select distinct ?Concept where {[] a ?Concept} LIMIT 100
則可利用該鏈接得到數據:
http://dbpedia.org/sparql?query=select%20distinct%20?Concept%20where%20{[]%20a%20?Concept}%20LIMIT%20100
其中空格被轉成%20。
實現細節
•跨域
我們可以通過AJAX實現這一功能,但是AJAX在部分瀏覽器中無法跨域,然而很顯然我們想要的Linked Data幾乎都是跨域的。
實際上,在一些較老版本的瀏覽器,我們沒有不改變其數據形式的方法在前端進行動態跨域異步讀取。
不過我們可以通過服務器代理的方法來解決跨域問題。
•GET or POST
使用GET還POST呢?
這個可能出于很多方面考慮,但是考慮到GET可能被緩存,所以我們使用POST來避免數據被緩存。
•以什么形式返回數據
前面我們說到用text/xml可以返回RDF數據,但是RDF在Javascript中并不好處理,所以我們使用json方式返回,也就是需要將Accept設置成application/sparql-results+json。
實現
接口參考Python的SPARQL Wrapper
代碼如下:
(function(root, factory) {
if(typeof define === "function"){
define("SPARQLWrapper", factory); // AMD || CMD
}else{
root.SPARQLWrapper = factory(); // <script>
}
}(this, function(){
'use strict'
function SPARQLWrapper(endpoint){
this.endpoint = endpoint;
this.queryPart = "";
this.type = "json";
}
SPARQLWrapper.prototype = {
constructor: SPARQLWrapper,
setQuery: function(query){
this.queryPart = "query=" + encodeURI(query);
},
setType: function(type){
this.type = type.toLowerCase();