語義網/學術化語義網
不幸的是,語義網社群中存在著學術和企業思維的氛圍,這導致了“學術化語義網”一詞的出現,以及大量錯誤/虛假資訊和不必要的炒作的傳播。請注意,本檔案旨在幫助澄清人們可能對語義網的一些常見誤解。
例如,幾乎所有 RDF 的初學者都會經歷一種“身份危機”階段,他們會將人與他們的名字混淆,將文件與它們的標題混淆。例如,常見的語句如下:
<http://example.org/> dc:creator "Bob" .
然而,Bob 只是一個字面字串,那麼字面字串怎麼能寫文件呢?作者真正想表達的是:
<http://example.org/> dc:creator _:b . _:b foaf:name "Bob" .
也就是說,example.org 是由一個名叫“Bob”的人建立的。像這樣的提示正在慢慢收集,其中一些被展示在 SWTips 指南中,該指南是作為協作開發專案維護的語義網提示和技巧的集合。
教育和推廣
從某種程度上來說,從“學術化語義網”向更大眾化的方向發展,是將語義網的力量帶給人們的一種運動的一部分。這是一個有據可查的需求:
|
[...] 認為上面提到的 URI 揭示了一種以某種方式完全描述了這種語言的模式,並且它非常簡單(只有兩個 {數一下,只有 2 個} 可能的“語句”),但看起來像是飛往火星的食譜有點令人望而生畏。它本身的簡單性使其能夠評估和報告幾乎所有內容 - 從文件到語言再到指南!它是語義網的一個基本工具,因為它賦予了“權力於人民”,他們可以對任何事物說任何話。 - EARL for dummies,William Loughborough,2001 年 5 月 |
RDF Schema 和 DAML+OIL 通常是需要學習的語言,但是,為了適應那些既沒有時間也沒有耐心去學習這些語言,但又想建立語義網應用程式的人,人們都在做什麼呢?值得慶幸的是,許多語義網應用程式將是低端應用程式,因此您不需要了解 RDF,就像 Amaya 需要了解 (X)HTML 一樣。信任和證明
語義網架構的下一步是信任和證明。關於這一層的描述很少,這很可惜,因為它在未來將變得非常重要。
現實情況是,最簡單的解釋是:如果一個人說 x 是藍色的,而另一個人說 x 不是藍色的,難道整個語義網不會崩潰嗎?
答案當然是否定的,因為 a) 目前語義網上的應用程式通常依賴於上下文,以及 b) 因為未來的應用程式通常將包含證明檢查機制和數字簽名。上下文
語義網上的應用程式通常會依賴於上下文,讓人們知道他們是否信任資料。如果我從朋友那裡獲得關於他看過的電影以及他對這些電影的評價的 RDF 提要,我知道我信任這些資訊。此外,我可以利用這些資訊並安全地信任它來自他,然後由我自己判斷我對他所評論的電影的評價有多信任。
人們也會在共同的上下文中運作。如果一個小組正在開發一個語義網描述服務,記錄人們是誰、他們的名字是什麼,以及他們照片在哪裡,那麼我對該小組的信任取決於我對該小組運營人員的信任程度,他們不會做出虛假宣告。
因此,上下文是一件好事,因為它讓我們能夠在本地和中等規模上直觀地運作,而不必依賴於複雜的認證和檢查系統。但是,當我們認識一個方,但我們不知道如何驗證某個 RDF 資料堆是否來自他們時,會發生什麼?這就是數字簽名發揮作用的地方。
一般來說,存在小型和大型系統,兩者之間的互動很可能構成語義網發生的事務的很大一部分。讓我們定義一下我們所說的大型、中等和小型系統。
大型系統
大型系統的例子是兩家公司正在進行合併,需要合併他們的資料庫。另一個例子是搜尋引擎根據大量資料彙集結果。大型語義網系統通常涉及大型資料庫,並且需要強大的推理規則和處理器來處理這些資料庫。中等規模
中等規模的語義網系統試圖從大型語義網系統中獲取意義,或者作為小型語義網系統的例子,它們結合在一起。前者的例子是,一家公司試圖部分理解兩種大型發票格式,以便將它們一起使用。後者的例子是,兩個通訊簿語言組試圖建立一種超級通訊簿語言。
小規模
小型語義網系統討論得較少。所謂小型語義網系統,指的是主要離線使用的語言,或者只在有限範圍內傳輸的資料堆,可能在朋友、部門之間,甚至在兩家公司之間。
在本地級別共享資料是一個非常強大的例子,說明語義網如何在無數情況下發揮作用。在下一節關於演化的部分,我們將瞭解不同規模的系統之間的互動將如何構成語義網的關鍵部分。SEM - 語義記憶
語義記憶的概念最初是由 Seth Russell 提出的,他建議將個人從“其餘”語義網(一種語義雲)中收集的 RDF 資料庫轉儲作為維護資料一致檢視的必要條件。例如,SEM 最有可能被劃分為對整個語義網固有的資料(即主要語言的模式,如 XML RDF、RDF Schema、DAML+OIL 等),對於任何可能正在執行的語義網應用程式來說很重要的本地資料(例如關於 CWM 邏輯名稱空間的資訊,目前已內建),以及個人一直在使用、釋出或以其他方式輸入 SEM 根上下文中的資料。
SEM 的內部結構很可能遠遠超出 RDF 的通常的三元組結構,可能擴充套件到四元組甚至五元組。額外的欄位用於上下文(StID),以及可能的序列。換句話說,它們是在 SEM 中分組資訊的方法,以便於維護和更新。例如,應該很容易刪除透過刪除具有特定 StID 的所有三元組來新增到特定上下文中的任何三元組。
許多關於語義網的工作集中在使資料儲存(即 SEM)互操作,這很好,但導致對 SEM 本身實際發生的事情的研究較少,這不好,因為四元組和五元組在 RDF 中的表示因此懸而未決。b 開發人員在這個階段進行調查。