語義網/簡介
語義網 是全球資訊網 (WWW) 的一項激動人心的演變,它提供了機器可讀 和機器可理解 的資訊,遠遠超出了當前的能力。在資訊氾濫的時代,政府、個人和企業將越來越依賴自動化服務,這些服務將透過“理解”網路上的更多內容來提高協助人類的能力。這對當今所有企業都有可能產生深遠的影響。
網路上的更多資訊需要以機器可以“理解”和處理而不是僅僅顯示的形式進行結構化。它完全依賴於機器透過對定義明確的資料執行定義明確的操作來解決複雜問題的能力。全球資訊網的發明者蒂姆·伯納斯-李創造了“語義網”一詞來描述這種方法。伯納斯-李、亨德勒和拉西拉給出了以下定義
| “ | 語義網不是一個獨立的網路,而是當前網路的擴充套件,其中資訊被賦予了明確的含義,從而使計算機和人類能夠更好地協同工作。 | ” |
—蒂姆·伯納斯-李,奧拉·拉西拉,詹姆斯·亨德勒,科學美國人 2001 年 5 月 | ||
語義網是一個在全球範圍內以機器易於處理的方式連結起來的資訊網格。您可以將其視為一種在全球資訊網上高效表示資料的形式,或者將其視為一個全域性連結的資料庫。
語義網是由 WWW、URI、HTTP 和 HTML 的發明者蒂姆·伯納斯-李構思的。全球資訊網聯盟 (W3C) 有一支專門的團隊致力於改進、擴充套件和標準化該系統,並且已經開發了許多語言、出版物、工具等。然而,語義網技術仍然處於起步階段,儘管該專案總體前景看好,但關於早期語義網的可能方向和特徵似乎沒有達成共識。
為什麼需要這樣一個系統?通常隱藏在 HTML 檔案中的資料在某些情況下很有用,但在其他情況下卻無用。目前,網路上大多數以這種形式存在的資料的問題是,很難在大型範圍內使用,因為沒有一個全球性的系統可以以一種易於任何人處理的方式釋出資料。例如,只需考慮一下關於當地體育賽事的資訊、天氣資訊、航班時間、美國職業棒球大聯盟統計資料和電視指南……所有這些資訊都由眾多網站提供,但所有這些資訊都以 HTML 格式呈現。問題是,在某些情況下,很難以人們可能想要的方式使用這些資料。
因此,語義網可以被視為一項巨大的工程解決方案……但它不僅僅是工程解決方案。我們會發現,隨著以可重複使用形式釋出資料變得更加容易,更多人會想要釋出資料,並且會產生連鎖反應或多米諾骨牌效應。我們可能會發現,大量語義網應用程式可以用於各種不同的任務,從而提高網路上應用程式的模組化程度。但足夠的主觀推理……進入如何實現這一點。
語義網通常建立在使用 URI 來表示資料的語法之上,通常以三元組結構的形式,即許多可以儲存在資料庫中或使用專門為該任務開發的一組特定語法在全球資訊網上交換的三元組 URI 資料。這些語法稱為“資源描述框架”語法。URI - 統一資源識別符號
URI 只是一個網路識別符號:就像您在全球資訊網上經常看到的以“http:”或“ftp:”開頭的字串一樣。任何人都可以建立 URI,並且它們的擁有權明確委託,因此它們構成了構建全球網路的基礎技術。事實上,全球資訊網就是這樣:任何具有 URI 的東西都被認為是“在網路上”。
URI 的語法由 IETF 嚴格管理,IETF 釋出了 RFC 2396 作為通用 URI 規範。W3C 維護一個 URI 方案列表。