跳轉到內容

XQuery/SPARQL 教程

來自華夏公益教科書
(重定向自 XQuery/RDF 和 Emp-Dept 案例研究)

SPARQL 介面

[編輯 | 編輯原始碼]

emp-dept RDF 可以透過 XQuery 前端 使用 SPARQL 查詢 儲存,由 Talis 提供。該指令碼支援 SPARQL 查詢和瀏覽 RDF 圖。


該介面擴充套件了查詢,例如

  select ?name ?job where {
   ?emp rdf:type  f:emp.
   ?emp foaf:surname ?name.
   ?emp f:Job ?job.
  }

您可以在 此處 [失效連結] 執行

 prefix foaf: <http://xmlns.com/foaf/0.1/>
 prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
 prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>
 prefix f: <http://www.cems.uwe.ac.uk/empdept/concept/>
 prefix xs: <http://www.w3.org/2001/XMLSchema#>
 select ?name ?job 
  where {
   ?emp rdf:type  f:emp.
   ?emp foaf:surname ?name.
   ?emp f:Job ?job.
 }

並將其傳送到 Talis 服務,該服務以可執行的形式提供,您可以在 此處 執行。生成的 SPARQLQuery Results XML 會被轉換為 HTML。

示例查詢

[編輯 | 編輯原始碼]

列出所有員工

[編輯 | 編輯原始碼]
 select ?emp where {
  ?emp  rdf:type  f:emp.
 }

執行 [失效連結]

按字母順序列出所有員工姓名

[編輯 | 編輯原始碼]
 select ?name where {
  ?emp  rdf:type  f:emp.
  ?emp  foaf:surname ?name. 
 }
 ORDER BY ?name

執行 [失效連結]

列出員工的姓名、薪資、部門編號和職位

[編輯 | 編輯原始碼]
 select ?name ?sal ?dno ?job where {
  ?emp  rdf:type  f:emp;
        foaf:surname ?name;
        f:Sal ?sal;
        f:Dept ?dept;
        f:Job ?job.  
  ?dept f:DeptNo ?dno. 
 }

請注意,; 代替 . 用於重複主體。

請在 此處 [失效連結] 嘗試此查詢和後續查詢。

列出前 5 名員工

[編輯 | 編輯原始碼]
select ?ename where {
  ?emp  rdf:type  f:emp;
        foaf:surname ?ename.
} 
ORDER BY ?ename
LIMIT 5

列出薪資最高的 5 名員工

[編輯 | 編輯原始碼]
select ?ename ?sal where {
 ?emp  rdf:type  f:emp;
       foaf:surname ?ename;
       f:Sal ?sal.
} 
ORDER BY DESC(?sal)
LIMIT 5

列出部門

[編輯 | 編輯原始碼]
select ?dept where {
  ?dept  rdf:type  f:dept.  
}

列出所有部門和所有員工

[編輯 | 編輯原始碼]
select ?dept ?emp where {
  {?dept  rdf:type  f:dept }
  UNION
  {?emp rdf:type f:emp}
}

列出薪資超過 1000 的員工

[編輯 | 編輯原始碼]

如果 RDF 文字型別,例如 xs:integer,就像此生成的 RDF 一樣,則以下查詢將選擇薪資大於 1000 的員工


select ?emp ?sal where {
  ?emp  rdf:type  f:emp;
        f:Sal ?sal.
  FILTER (?sal > 1000)
}

如果 RDF 文字沒有型別,則必須強制轉換變數

 select ?emp ?sal where {
  ?emp  rdf:type  f:emp;
        f:Sal ?sal.
  FILTER (xs:integer(?sal) > 1000)
}

列出員工及其所在地

[編輯 | 編輯原始碼]
select ?emp ?loc where {
  ?emp  rdf:type  f:emp.
  ?emp f:Dept ?dept.
  ?dept f:Location ?loc.
}

列出員工姓名及其經理

[編輯 | 編輯原始碼]
select ?ename ?mname where {
  ?emp  rdf:type  f:emp;
        f:Mgr ?mgr;
        foaf:surname ?ename.
  ?mgr foaf:surname ?mname.
} 

包括沒有經理的員工

[編輯 | 編輯原始碼]
select ?ename ?mname where {
  ?emp  rdf:type  f:emp;
        foaf:surname ?ename.
  OPTIONAL {?emp f:Mgr ?mgr.
            ?mgr foaf:surname ?mname.
           }
}

列出沒有經理的員工

[編輯 | 編輯原始碼]
select ?ename where {
  ?emp  rdf:type  f:emp;
        foaf:surname ?ename.
  OPTIONAL {?emp f:Mgr ?mgr}
  FILTER (!bound(?mgr))
}

列出員工的不同所在地

[編輯 | 編輯原始碼]
select distinct ?loc  where {
  ?emp  rdf:type  f:emp.
  ?emp  f:Dept ?dept.
  ?dept f:Location ?loc.
} 


列出所有分析師的詳細資訊

[編輯 | 編輯原始碼]
select * where {
  ?emp  rdf:type  f:emp.
  ?emp  f:Dept ?dept.
  ?dept f:Location ?loc.
  ?emp f:Job ?job.
  FILTER (?job = "ANALYST")
} 


列出既是分析師又是經理的員工

[編輯 | 編輯原始碼]
select ?emp where {
  ?emp  rdf:type  f:emp;
        f:Job ?job.
  FILTER (?job = "ANALYST"  || ?job = "MANAGER")
}

列出既不是分析師也不是經理的員工

[編輯 | 編輯原始碼]
select * where {
   ?emp  rdf:type  f:emp;
         f:Job ?job.
   FILTER (?job != "ANALYST"  && ?job != "MANAGER")
}

列出姓氏以“S”開頭的員工

[編輯 | 編輯原始碼]
select * where {
  ?emp  rdf:type  f:emp.
  ?emp foaf:surname ?ename.
  FILTER (regex(?ename, "^S"))
} 

列出姓氏包含“AR”的員工

[編輯 | 編輯原始碼]
select * where {
  ?emp  rdf:type  f:emp.
  ?emp foaf:surname ?ename.
  FILTER (regex(?ename, "AR"))
} 

列出姓氏包含“M”後跟“R”的員工,不區分大小寫

[編輯 | 編輯原始碼]
select * where {
  ?emp  rdf:type  f:emp.
  ?emp foaf:surname ?ename.
  FILTER (regex(?ename, "m.*r","i"))
}

計算最高薪水

[編輯 | 編輯原始碼]

SPARQL 1.0 缺乏 min() 或 max(),雖然它們被新增到了某些實現中。以下方法,由 Dean Allemang 提供,可以用來實現。

select ?maxemp ?maxsal where {
 ?maxemp  rdf:type  f:emp.
 ?maxemp  f:Sal ?maxsal.
 OPTIONAL { ?emp rdf:type f:emp.
            ?emp f:Sal ?sal.
            FILTER ( ?sal > ?maxsal)
          }.
 FILTER (!bound (?sal))
}


這是如何工作的?我們尋找 **最高** 員工的最高薪水。對於這樣的員工,OPTIONAL 子句將不匹配,因為沒有員工的薪水更高,因此 ?sal 將不會繫結。

在 SPARQL 1.1 中,允許使用 max() 和 min(),所以返回最高薪水的查詢變為

select (max(?sal) as ?maxsal) where {
  ?maxemp  rdf:type  f:emp.
  ?maxemp  f:Sal ?sal.
}

計算具有相同薪水的員工

[編輯 | 編輯原始碼]
 select * where {
    ?emp1 f:Sal ?sal.
    ?emp2 f:Sal ?sal.
    FILTER (?emp1 != ?emp2)
 }

獲取 SMITH 所在的部門

[編輯 | 編輯原始碼]
select ?dname  where {
  ?emp  rdf:type  f:emp.
  ?emp f:Dept ?dept.
  ?emp foaf:surname "SMITH".
  ?dept f:Dname ?dname.
}

列出會計部門員工的姓名

[編輯 | 編輯原始碼]
select ?ename  where {
  ?emp  rdf:type  f:emp.
  ?emp f:Dept ?dept.
  ?emp foaf:surname ?ename.
  ?dept f:Dname "Accounting".
} 


本世紀僱用的員工

[編輯 | 編輯原始碼]
select ?ename ?hire where {
 ?emp  rdf:type  f:emp.
 ?emp f:HireDate ?hire.
 ?emp foaf:surname ?ename.
 FILTER (?hire > "2000-01-01"^^xs:date) 
}

請注意,需要對字面量進行型別化才能使比較工作正常。

列出其經理在不同部門的員工姓名

[編輯 | 編輯原始碼]
select ?name ?edname ?mdname {
  ?emp  rdf:type  f:emp;
        foaf:surname ?name;
        f:Dept ?dept;
        f:Mgr ?mgr.
  
   ?mgr f:Dept ?mdept. 
   ?dept f:Dname ?edname.
   ?mdept f:Dname ?mdname.
   FILTER (?dept != ?mdept)
}

列出員工的等級

[編輯 | 編輯原始碼]

在關係術語中,這是員工和 salgrade 表之間的 theta 連線。

select ?ename ?grade where {
 ?emp  rdf:type  f:emp;
       foaf:surname ?ename;
       f:Sal ?sal.
 ?salgrade rdf:type f:salgrade; 
       f:LoSal ?low; 
       f:HiSal ?high;
       f:Grade ?grade.
   
 FILTER (?sal >= ?low && ?sal <= ?high)
 }

簡化查詢語法

[編輯 | 編輯原始碼]

一個新的字首簡化了透過 URI 引用單個資源的過程。

 prefix e: <http://www.cems.uwe.ac.uk/empdept/emp/>
 select ?sal  where {
    e:7900 f:Sal ?sal.
 }

是 的簡寫。

 select ?sal  where {
    <http://www.cems.uwe.ac.uk/empdept/emp/7900> f:Sal ?sal.
 }

我們也可以引入一個預設名稱空間

prefix : <http://www.cems.uwe.ac.uk/empdept/concept/>
select ?name ?sal ?dno ?job where {
 ?emp  rdf:type  :emp;
       foaf:surname ?name;
       :Sal ?sal;
       :Dept ?dept;
       :Job ?job.  
 ?dept :DeptNo ?dno. 
}

並使用縮寫 **a** 代表 rdf:type

prefix : <http://www.cems.uwe.ac.uk/empdept/concept/>
select ?name ?sal ?dno ?job where {
 ?emp  a :emp;
       foaf:surname ?name;
       :Sal ?sal;
       :Dept ?dept;
       :Job ?job.  
 ?dept :DeptNo ?dno. 
}

如果我們不需要返回資源本身,它可以是匿名的

prefix : <http://www.cems.uwe.ac.uk/empdept/concept/>
select ?name ?sal ?dno ?job where {
 [ a :emp;
   foaf:surname ?name;
   :Sal ?sal;
   :Dept ?dept;
   :Job ?job
 ].
 ?dept :DeptNo ?dno. 
}

聚合功能

[編輯 | 編輯原始碼]

聚合函式,如 count() 和 sum() 以及 GROUP BY 子句,在 SPARQL 1.0 中沒有定義,儘管它們在某些服務(例如 Talis 平臺)中可用,以先於 SPARQL 1.1 中的標準化。


計算部門數量

[編輯 | 編輯原始碼]
select (count(?dept) as ?count) where {
  ?dept  rdf:type  f:dept.

}

計算每個部門的員工數量

[編輯 | 編輯原始碼]
select distinct ?dept (count(?emp) as ?count) where {
  ?dept a f:dept.
  ?emp f:Dept ?dept.
} group by ?dept

通用查詢

[編輯 | 編輯原始碼]

三元組資料模型的統一性使我們能夠以非常通用的方式查詢資料集,這在我們對資料一無所知時非常有用。

列出所有資料

[編輯 | 編輯原始碼]
select * where {
 ?s ?p ?o
}

這對真實資料集來說是不切實際的,但可以透過限制返回的三元組數量來獲取三元組樣本。

select * where {
 ?s ?p ?o
} LIMIT 20 

列出所有員工資料

[編輯 | 編輯原始碼]
select ?prop ?val where {
  ?emp  rdf:type  f:emp.
  ?emp ?prop ?val.
}

有哪些型別?

[編輯 | 編輯原始碼]
select distinct ?type where {
  ?s a ?type
}

這表明定義 emp 詞彙的三元組在同一個資料集中。

有哪些屬性?

[編輯 | 編輯原始碼]
select distinct ?prop where {
   ?s ?prop ?o
}

屬性的域(或域)是什麼?

[編輯 | 編輯原始碼]
select distinct ?type where {
    ?s f:Sal ?v.
    ?s a ?type.
}

屬性的範圍是什麼?

[編輯 | 編輯原始碼]
select distinct ?type where {
    ?s f:Sal ?o.
    ?o a ?type.
}


此查詢僅查詢資料集中作為型別例項的範圍。Sal 的範圍是 xs:integer,但用 SPARQL 查詢很難發現這一點。


select distinct ?type where {
    ?s f:Mgr ?o.
    ?o a ?type.
}

哪些屬性具有給定型別作為其域?

[edit | edit source]
select distinct ?prop where {
     ?s a f:salgrade.
     ?s ?prop [].
}

模式查詢

[edit | edit source]

模式資料的存在使 SPARQL 可以用來查詢這些元資料。結果可以與直接查詢資料的結果進行比較。

哪些屬性具有給定型別的域?

[edit | edit source]
select ?prop  where {
   ?prop rdfs:domain f:emp.
}


請注意,這僅返回了 empdept 詞彙表中的屬性,而不是原始資料中使用的 foaf name 屬性。

員工有哪些整數屬性?

[edit | edit source]
select ?prop  where {
   ?prop rdfs:domain f:emp.
   ?prop rdfs:range xs:integer.
}

哪些型別的資源有薪資?

[edit | edit source]
select ?type where {
  f:Sal rdfs:domain ?type.
}


可以對資料和詞彙表進行查詢


MANAGER 有哪些字面屬性?

[edit | edit source]
select DISTINCT ?prop  where {
   ?x f:Job "MANAGER".
   ?x a ?type. 
   ?prop rdfs:domain ?type.
   ?prop rdfs:range rdfs:literal.
}

待辦事項

[edit | edit source]
  • 示例 RDF 缺少語言標籤,這些標籤是說明 lang() 函式所必需的
  • 所有查詢應與 SQL 和 XQuery 等效項一起移至程式碼列表
華夏公益教科書