ETD 指南/技術問題/DiTeD 和 DIENST
論文和學位論文傳統上受到葡萄牙法律存款法的保護。如今,幾乎所有的論文和學位論文都是使用文字處理器建立的,這證實了科學技術已成為數字化出版的先驅領域之一。
在這種情況下,論文和學位論文的存款成為一個理想的案例研究,專注於特定型別的場景。為此,葡萄牙國家圖書館推出了 **DiTeD-數字論文和學位論文** 專案,並由此衍生出一個同名軟體包。
需求
論文和學位論文在註冊和訪問方面有特殊要求,因為其內容通常用於生成其他型別作品,例如書籍和論文,或者可能包含與例如專利相關的敏感材料。這要求管理系統具有功能,使作者能夠宣告對訪問的特殊要求,這些要求必須進行註冊並得到尊重。
大學在組織、文化和程式方面有著悠久的獨立傳統。因此,很快人們就意識到,在短期和中期內,無法與不同的行政服務機構達成任何形式的共同格式或標準程式的總體協議。因此,DiTeD 的主要目標是在網際網路之上開發一個框架,將國家圖書館連線到當地大學圖書館,並支援論文和學位論文存款的完整數字迴圈。
架構
DIENST 技術 [3] 為此框架提供了一種解決方案,它提供了一套完善的核心服務。DIENST 還具有開放式架構,可以靈活使用,可以擴充套件其服務並構建新功能。該架構的基本實體如 UML - 統一建模語言中的類圖所示,如圖 1 所示。
主伺服器
主元資料伺服器提供集中式服務,包括系統中所有本地伺服器成員的目錄。每個系統中只能存在一臺這樣的伺服器。
在 DiTeD 中,該伺服器位於國家圖書館。它被重新命名為主伺服器,並且與為 DIENST 開發的原始版本有很大不同。原始伺服器僅用於管理元資料,而現在需要管理論文或學位論文的內容,並支援其提交和存款的工作流程。
DIENST 標準伺服器
DIENST 標準伺服器是安裝在大學圖書館的伺服器。該伺服器在 DiTeD 中進行了修改,並被重新命名為本地伺服器。以下核心模組組成它:
- 儲存庫服務:這是儲存文件的地方。它管理元資料結構和同一文件的多種內容格式,這些功能在 DiTeD 中得到了大幅擴充套件(以支援特定的元資料格式,以及將論文或學位論文識別為可能由多個檔案組成)。還可以定義和管理同一伺服器中的不同集合。
- 索引服務:該服務負責索引元資料並響應查詢。DiTeD 中進行了一些小的調整,以支援索引和查詢中的變音符號,這是葡萄牙語寫作中的一個要求。
- 使用者介面:該服務負責與使用者的互動。它在 DiTeD 中進行了擴充套件,以支援靈活的多語言介面和使用 HTTP 的提交工作流程。
識別符號
國家圖書館正在執行兩臺本地伺服器。一臺名為“存款伺服器”,用於本地儲存來自所有大學的已存款論文和學位論文(存款將包含一份副本,因此最終每篇論文或學位論文都將存在於兩個地方,本地伺服器和存款伺服器)。第二臺本地伺服器被用作虛擬系統,供那些沒有必要的技術資源或技能來維護自己伺服器的大學圖書館使用。
在 DiTeD 中存款的每篇論文或學位論文都會自動獲得一個 URN [4],該 URN 將由名稱空間和解析服務進行註冊和管理。這實際上是對 PURL - 永久 URL 概念的簡單實現,它具有以下特殊屬性:它透過返回原始本地伺服器中的真實 URL 來解析任何 PURL,除非該 PURL 不再可用。在這種情況下,它透過返回其在存款伺服器中的 URL 來解析它。該最終 DiTeD 架構的實體如圖 2 所示。
URN 的字首格式為 "HTTP://PURL.PT/DITED",而後綴由大學圖書館(“釋出者”)的識別符號和工作本身的特定識別符號組成,該識別符號在本地自動分配。
工作流程
工作流程包含兩個主要步驟:提交和存款。
提交
提交過程包含以下步驟:
交付:該過程從學生向本地伺服器提交論文或學位論文開始。在此步驟中,學生填寫元資料表格,記錄書目資訊和訪問條件。所有這些資訊都處於待處理狀態,直到被檢查。
驗證:在第二步中,圖書管理員檢查提交的質量(在本地伺服器上登入可以訪問所有待處理的提交)。這項任務應該由當地圖書管理員負責,但也可以遠端負責,例如由國家圖書館的專業人員負責(在專案的第一階段,這項任務將由國家圖書館負責,特別是在確保標準的一致性並測試和調整程式方面)。
註冊:如果一切正確(元資料和內容),論文或學位論文將儲存在本地儲存庫中,學生將收到確認。否則,將聯絡學生以解決任何問題,並且提交將保持待處理狀態。
存款
存款是指將論文或學位論文以及其元資料從本地伺服器複製到存款伺服器。這將在以下步驟中完成:
新增內容:主伺服器會定期聯絡本地伺服器的儲存庫,以檢查是否有新的提交。本地伺服器會回覆,提供新提交的識別符號列表。
交付:對於每個新提交,主伺服器會向本地伺服器傳送請求,要求將其存入存款伺服器。由於該存款伺服器也是本地伺服器,因此該存款與正常的本地提交一樣。
驗證:國家圖書館的圖書管理員會檢查存款。這種雙重檢查非常重要,尤其是在專案的初期,以便重新評估程式並測試檔案透過網際網路的自動傳輸 - 這並不總是可靠的過程)。
註冊:如果一切正確,論文或學位論文將儲存在存款儲存庫中,最終的 URN(一個 PURL)將被分配,學生和當地圖書管理員都會收到確認。元資料也將被重新用於生成用於國家目錄的標準 UNIMARC 記錄。如果檢測到任何問題,將聯絡當地圖書管理員,並且存款將保持待處理狀態。
有人可能會爭辯說,如果存款伺服器實際上也是本地伺服器,那麼第一步將被免除,本地伺服器可以在提交成功後自動執行交付。這可能是未來的最佳化,但目前,此額外步驟的原因是為了保持非同步系統的要求,例如使主伺服器能夠更好地控制存款時間(例如,優先考慮夜間時間)。
元資料
DiTeD 使用國家圖書館定義並以 XML 編碼的論文和學位論文的元資料結構。該結構包含有關作品和作者的描述性書目資訊,以及有關指導教師和評審委員會成員、訪問條件等資訊。該元資料結構在安裝時可配置,使軟體可以靈活地在其他國家/地區使用,甚至用於其他出版型別。元資料也可以以其他格式訪問和匯出,例如 UNIMARC 和 Dublin Core。
多語言介面
DiTeD 的使用者介面具有多語言功能,允許使用者隨時在可用語言之間切換。基本配置包括英語和葡萄牙語。
軟體可用性
該軟體由葡萄牙國家圖書館維護,並免費用於非商業用途。可以透過電子郵件 dited@bn.pt 申請訪問軟體包。
參考文獻
- <http://dited.bn.pt>
- <http://purl.org>
- <http://www.cs.cornell.edu/cdlrg/dienst/software/DienstSoftware.htm>
- Sollins, K; Masinter, L. (1994). 統一資源名稱的功能要求。 RFC 1737.
下一節: ADT

