選擇合適的文件格式/文字檔案
在大多數型別的組織中,文字檔案是除財務報表之外最重要的電子資訊型別。根據文件的內容,有多種格式可供選擇。
有三種類型的文字檔案:純文字檔案 - 純文字,沒有格式,沒有字型選擇。文字檔案 - 可以選擇字型、顏色、文字大小、背景和嵌入影像(聲音/影片等)。簡報檔案 - 包含文字檔案的所有選項,但對進一步編輯有限制。
對於純文字檔案,最簡單、最持久的格式是ASCII(美國資訊交換標準程式碼)。它自 1963 年以來一直在發展,並且一定是歷史上支援率最高的單一格式。然而,它也很有限。唯一可用的格式是換行符的選擇。沒有嵌入任何影像或顏色,也不支援變音符號或非拉丁文字。有許多其他基於 ASCII 的編碼,它們增加了對更多字元的支援。在西方世界,windows-1252(與 ISO-8859-1 密切相關)是最常見的編碼。世界其他地區將有其他約定。UTF-8 可以表示所有實際使用的語言的文字,並且正變得越來越普遍,可能是長期儲存文字的最佳選擇。
使用基於 ASCII 的編碼的文字檔案通常以 .txt 字尾表示,但很難自動確定使用哪種編碼。因此,最好嘗試找出您正在使用的編碼並記錄下來。如果您真的擔心,您可能還想找到並存儲將該編碼轉換為 unicode 的權威表格(嘗試 http://www.iana.org/assignments/character-sets 和 http://www.unicode.org/Public/MAPPINGS/)。
對於 Windows 使用者,記事本是處理 TXT 檔案的預設應用程式。當前版本的記事本假設如果檔案是完全有效的 UTF-8 或具有 UTF-8 位元組順序標記,則為 UTF-8;如果檢測到 UTF-16 位元組順序標記,則為 UTF-16;否則為 Windows ANSI 內碼表(西方版本的 1252)。在緊急情況下,通常可以使用記事本和類似的編輯器從其他型別的檔案中獲取原始文字,並且嘗試對您計劃儲存的其他檔案執行此操作可能是有益的。
文字檔案是您在許多商業或免費文字處理程式上大部分時間產生的檔案。大多數情況下,您可能使用它來編寫基本的文字檔案。寫給朋友和同事的信件、專案列表等等。這種型別文字的應用程式可以在流行的辦公套件中找到,例如Microsoft Office、AppleWorks 和 OpenOffice.org。
為了保證文件的永續性,重要的是您今天編寫的文件明年仍然可以閱讀。很長一段時間以來,沒有針對文件的開放標準,因此相容性一直是一個持續的問題。當人們選擇從一個文件編輯器遷移到另一個文件編輯器時,他們取得了不同程度的成功,因為每個編輯器都使用自己的格式。.doc 格式現在得到了多個編輯器的良好支援。
無論您使用哪種文字處理程式,它都應該支援多種格式,選擇最持久的格式非常重要。雖然 開放文件 標準 (Version 1.0 於 2005 年 5 月被批准為 OASIS 標準) 正在進行,但 RTF (Rich Text Format) 是最廣泛支援和記錄的格式。您應該能夠將其設定為預設格式,以便所有將來的文件都以 RTF 格式儲存。(教程關於在 Microsoft Word 中更改預設格式)如果您選擇不這樣做,因為 RTF 不支援您需要的某些功能,您仍然應該考慮將 RTF 作為您的存檔格式。您的格式可能無法正確顯示,但至少您的內容會為後人保留下來。
如果您花時間製作簡報檔案,您就會知道文字處理程式在這方面是有限的。您可能正在使用 Adobe Illustrator/InDesign、sodipodi 或 CorelDRAW 等程式。這些程式很棒,但存檔它們可能會很棘手。
至少有兩種競爭選項,來自 Adobe 的 PDF,尤其是 PDF/A,以及來自 Microsoft 的 XPS。
行動式文件格式 (PDF) 是 Adobe Systems 於 1993 年建立的檔案格式,用於文件交換。PDF 是一種固定版式格式,用於以獨立於應用程式軟體、硬體和作業系統的形式表示二維文件。每個 PDF 檔案都封裝了二維文件的完整描述(以及 Acrobat 3-D 中的嵌入式三維文件),其中包括構成文件的文字、字型、影像和二維向量圖形。PDF 是一種開放標準,已於 2008 年 7 月 1 日由 ISO 正式釋出為 ISO 32000-1:2008。 "行動式文件格式 (PDF)" 維基百科線上百科全書,訪問日期:2008 年 7 月 4 日
PDF/A 在 ISO 19005-1:2005 文件管理 - 用於長期儲存的電子文件檔案格式 - 第 1 部分:PDF 1.4 的使用 (PDF/A-1) 中進行了描述,該標準於 2005 年 10 月 1 日釋出。該標準定義了一種用於長期存檔電子文件的格式 (PDF/A),它基於 Adobe Systems Inc. 的 PDF 參考版本 1.4(在 Adobe Acrobat 5 中實現)。PDF/A 事實上是 PDF 的一個子集,它省略了不適合長期存檔的 PDF 功能。這類似於為印刷和圖形藝術定義的 PDF/X 子集。 "PDF/A" 維基百科線上百科全書,訪問日期:2008 年 7 月 4 日
XML 紙張規範 (XPS),以前代號為“Metro”,是微軟開發的一種頁面描述語言和固定文件格式的規範。它是一種基於 XML(更準確地說,基於 XAML)的規範,基於新的列印路徑和基於顏色的向量文件格式,支援裝置獨立性和解析度獨立性。 "XML 紙張規範 (XPS)" 維基百科線上百科全書,訪問日期:2008 年 7 月 4 日
使用 PDF 檔案時需要注意的一點:不要使用 PDF 檔案的內建壓縮,如果可能,請使用 PDF 1.4 規範。
建議
- 儘可能使用純 ASCII 文字
- 在格式很重要或需要包含圖形時使用 ODT
- 對於將來不需要編輯的文件,使用 PDF 或 XPS
參考資料
- 開放文件 在維基百科