跳轉到內容

ETD 指南/技術問題/識別: URN、PURL、DOI

來自華夏公益教科書,開放的書籍,為開放的世界

在網際網路上分發的資源可以透過與其實際位置相對應的語法訪問。這種語法由RFC 1738定義,稱為統一資源定位符 (URL)。這種方式會造成某些問題,我們經常需要面對。誰沒有遇到過著名的 HTTP 錯誤 404 未找到,它表明伺服器無法找到請求的資源的位置?這並不意味著資源不再伺服器上,因為它可能只是被移動到另一個位置。當資源被移動到另一個位置時,URL 無法自動更新,因此我們經常會遇到那個著名的 HTTP 錯誤。

雖然 URL 標識資源的地址,但統一資源名稱 (URN) 標識實際的資源,即資訊單元,就像 ISBN 對書籍一樣。為了進行比較,URL 相當於使用者的郵政地址,而 URN 相當於使用者的社會保險號或社會安全號。因此,URN 附加到資源,而不是物理地址。透過知道這個識別符號,即使資源的物理地址發生變化,也可以找到這個資源。URN 確保機構承諾維護對網際網路上資源的訪問。

在蒙特利爾大學於 1999-2000 年進行的數字論文試點專案框架內,我們實施了一個基於 CNRI 提出的模型生成 URN 的系統。位於 CNRI 的全球伺服器管理“命名機構”,這些機構指的是出版商編號。安裝在論文分發站的本地伺服器反過來包含一個數據庫,它管理 URN 和 URL 之間的關聯。所有這些都與 NetworkSolution 管理 DNS 的系統非常相似,DNS 規範了連線到網際網路的計算機的 IP 地址,只是在我們的例子中,是文件被分配了地址,而不是計算機。

CNRI 提出的模型是 Handle 系統。該系統也是 DOI 基金會系統的基石。Handle 的構造分為兩部分。URN 的字首對應於出版商編號(蒙特利爾大學的出版商編號為 1012)。這個編號是唯一的,不能被任何其他組織使用。“子名稱”可以在這個編號之後新增,以便將其細分為更精確的單元。此序列後跟一個斜槓 (“/”) 和一個自由選擇的字母數字序列。因此,論文的 Handle 型別 URN 如下所示

hdl:1012.Theses/1999-Albert.Mathieu(1959)-[HTML]

我們選擇論文答辯年份、作者姓名、出生日期和檔案格式作為論文 URN 識別符號的組成要素。請注意,必須先下載 CNRI 的外掛才能使用 Handle 系統。該系統具有與RFC 1737關於規範 URN 系統框架的要求基本一致的優點。然而,它的應用是繁瑣的,因為絕對需要外掛才能解析連結。在對 CNRI 系統進行實驗後,蒙特利爾大學打算在我們的正在進行的電子論文專案中使用另一個系統。

另一個有趣的途徑是由 OCLC 建立的 PURL 系統。我們要注意,與 URN 使用的其他規範或應用相反,附加到 PURL 的文件可以修改。PURL 系統在很大程度上遵循與 Handle 系統相同的原理,只是 URN 是使用 URL 地址解析的。此解決方案的優點是不需要使用外掛。實際上,PURL 是一種 URL。PURL 並不直接指向網際網路資源,而是指向一箇中間解析服務。該服務將 PURL 與活動 URL 關聯,然後將其提供給客戶端。然後,客戶端通常會提供對資源的訪問。可以在中間服務(如 OCLC 的服務)中註冊 PURL,或者在自己的伺服器上安裝該服務。

參考文獻

  1. http://www.handle.net/
  2. http://www.doi.org/
  3. http://www.purl.org/
  4. http://purl.oclc.org/OCLC/PURL/INET96
  5. http://purl.oclc.org/OCLC/PURL/FAQ
  6. http://purl.oclc.org/

下一節: ETD 的元資料模型

華夏公益教科書