ETD 指南/技術問題/ETD 的 DTD
(本節摘自 P. Potter、P. Strabala、D. Dobratz 和 M. Schulz 關於 ETD 的文章,該文章將在“網際網路與高等教育”2001 年第 4 期發表)
XML 創作系統
目前可用的 XML 創作系統尚未得到廣泛認可,這導致各大學在處理 XML 文件方面採取了不同的策略。大多數這些專案始於 1995 年至 1997 年之間,當時 XML 正在蓬勃發展,但工具或標準化 DTD 卻寥寥無幾。從今天的角度來看,這些專案表明需要重新思考和重新設計這些方法,以便實現標準化。
DTD
所有提出的 DTD 都建立在相似的原則之上。一篇典型的學位論文(可以看作是一部專著)包含 3 個主要部分:一個可擴充套件的標題頁,其中包含摘要、宣告等;論文正文,其中包含文字、圖片、音訊、影片、表格等;以及附錄,其中包含資料表、參考文獻、致謝等。
以下 DTD 目前在不同的機構使用中
- ETD-ML.DTD:弗吉尼亞理工學院和州立大學(弗吉尼亞理工大學)
- DiML.DTD:德國線上博士論文專案
- UIowa2K.DTD:愛荷華大學
- HutPubl.DTD:赫爾辛基理工大學
- TEI-Light.DTD:安阿伯和里昂
- ISOBook.DTD:奧斯陸大學
- 基於 TEI 的 DTD,擴充套件了自然科學:瑞典農業科學大學烏普薩拉
作者-DTD
所有這些文件型別定義都是所謂的作者-DTD。這意味著它們主要用於支援創作和轉換過程,而並非主要針對文件歸檔和儲存。人們可能會問,為什麼這些不同的 DTD 能夠流行起來。這主要是因為上述大學的科學方向差異很大。里昂、奧斯陸和密歇根使用 TEI-Light.dtd,主要服務於文科和人文學科的學生。在柏林、赫爾辛基或烏普薩拉等擁有強大自然科學社群的大學,使用 TEI.DTD 或 DocBook.DTD 會遇到一些問題。通常一篇學位論文是一項累積性工作,例如在里昂或赫爾辛基。
拉瓦爾大學與蒙特利爾大學合作,在 2001-2002 年期間對 ETD 的新 DTD 模型進行了研究。該 DTD 及其文件將釋出在 http://www.theses.umontreal.ca 上。
用於多媒體內容的 DTD
“結構化資料”,如數學或化學公式、電子表格、地址簿、配置引數、金融交易、技術圖紙等,通常使用 Postscript 或 PDF 等佈局程式釋出在 Web 上,或者將其轉換為 gif、jpeg、png、vrml 等圖形格式。生成這些資料的程式通常還會將其儲存在磁碟上,使用二進位制或文字格式。因此,如果有人想檢視這些資料,他通常需要使用生成這些資料的程式。使用 XML,資料可以儲存在文字格式中,這允許使用者在沒有原始程式的情況下讀取檔案。XML 可以被看作是一組規則、指南或約定,用於設計資料的文字格式,從而生成易於生成和讀取(由計算機)的檔案。除了較舊的標準 SGML 之外,還有一些新興標準使用 XML 編碼來克服 HTML 網頁釋出的常見缺點。以下部分概述了近年來建立的標準,或仍在進行中的標準,但已被廣泛認可。
XML DTD 和 Schema
對於標準化的知識管理來說,各種各樣的 XML DTD 和 Schema 似乎令人困惑。但是,仔細觀察後,我們可以從另一個角度來看:每個科學學科都定義和使用自己的標準。以下文件型別定義可以大致分類為
- 使用語義標籤來標記真實內容項的 Schema,例如 MathML 或 CML。
- 用於視覺化和佈局目的,以及控制瀏覽器同步的 Schema,例如 HTML、SVG(可縮放向量圖形)、SMIL(同步多媒體整合語言)。
- 主要用於與大型資料庫交換資料的 Schema,例如 cXML(商業 XML)。
電子出版
在“電子出版”領域,這些發展為結構化科學資訊提供了新的機會,不僅包括基於文字的資訊,還包括所謂的主動內容和多媒體元素。這將整個領域提升到了一個新的資訊處理或知識管理水平。各大學在電子出版方面的不同方法創造了一個非常異構的環境。以下表格顯示了將所有這些不同的模型歸納到一個概念下以實現基於 XML 的有價值且可搜尋的資訊系統的難度。必須定義所有這些 DTD 之間的交叉對映,以便構建一個分散式檢索引擎,能夠在“全球範圍內”搜尋內部文件結構。不僅使用不同的 DTD,而且還使用不同的策略將常見的文字格式系統轉換為 SGML 或 XML 中的高度結構化文件。
| 合作伙伴 | DTD | 轉換為 SGML/XML | 從 SGML/XML 轉換為 HTML、PDF |
|---|---|---|---|
| 柏林洪堡大學 | DiML | Word 的 SGML-Author | Perl 指令碼、DSSSL |
| 弗吉尼亞理工學院和州立大學 | ETD | SGML-Author | Perl 指令碼 |
| 愛荷華大學 | Uiowa2K | Majix | CSS |
| 蒙特利爾大學/里昂第二大學 | TEI-Light | Omnimark rtf2sgml | XSL |
| 赫爾辛基理工大學 | HutPubl | FrameMaker+SGML | DSSSL、FrameMaker |
| 密歇根大學 | TEI-Light | Omnimark rtf2sgml | |
| 奧斯陸大學 | ISO-Book | Balise |
下一節:柏林 DTD 研討會