開放元資料手冊
開放元資料手冊是公共領域工作組和開放書目資料工作組的合作專案,隸屬於開放知識基金會.
本書旨在為非專家提供有關作品元資料釋出標準和最佳實踐的概述。其主要關注點是文化遺產機構的元資料,即 GLAM 機構(美術館、圖書館、檔案館和博物館)。
本書的編寫是為了幫助我們理解各種元資料集合,我們希望使用這些集合來確定哪些作品在哪些國家進入公共領域。在 OKF,我們一直在努力開發自動化計算來確定作品的公共領域狀態(參見http://publicdomain.okfn.org/calculators),我們很快意識到,我們通常沒有必要的元資料來準確地確定作品是否處於公共領域。我們從不同的來源獲得了資料,例如 BBC、英國國家圖書館,但我們需要以有意義的方式將這些資料結合起來,以便獲得更全面的元資料集。這要求我們參與詞彙對齊過程,消除重複條目,瞭解類似欄位是否實際上意味著相同的內容,以及確定不同的資料模型是否彼此相容。
這引發了一系列新的問題
- 有哪些不同的元資料標準?
- 它們如何與不同型別的作品相關?
- 它們各自的優缺點是什麼?
- 這些標準是否可以互操作?
- 它們是跨境的嗎?跨行業的嗎?
- 我們如何整合來自不同來源的資料?
本書旨在以淺顯但詳盡的方式回答其中一些問題。
開放元資料手冊並非
- 專為具有專業技術知識的人員設計的通用元資料指南。
- 又一個關於如何建立開放和互操作元資料模型的最佳實踐或建議系列。
開放元資料手冊是
- 一個關於現有工具和標準的簡單指南,嘗試繪製不同機構、組織和專案使用的元資料結構,包括但不限於 GLAM 機構。
- 一系列指南,幫助人們瀏覽該領域已經完成的大量工作,幫助他們透過元資料實現適當的文件發現和分析。
開放元資料手冊的最終目標是
- 幫助任何人都能瞭解元資料,即使他們沒有資料管理方面的教育。
- 鼓勵以互操作的方式開發和整合元資料。
- 簡化從各種來源收集和處理書目元資料。
- 促進社群參與本檔案的起草工作。
開放元資料手冊不僅關注文學作品(書籍、文章等),還關注藝術作品、音樂作品、視聽作品等等。雖然重點一般是書目作品,但也有大量關於電影/影片、聲音和製圖資料的元資料,以及關於資料集(人口普查等)的元資料。我們不打算提供對每個標準的詳細概述,而是透過一系列指向更準確資訊的指標,說明不同領域的最新技術水平。重要的是要探索如何使用元資料來描述不同型別的作品,以便確定元資料的使用是否(以及在多大程度上)因所考慮的作品型別而異。這也將使我們能夠確定哪種標準最適合每種型別的書目作品,以及原因。
開放元資料手冊分為 5 個部分
- 介紹,提供對最基本概念的定義
- 什麼是元資料?
- 元資料有什麼用?
- 它是如何產生的?
- 它是如何使用的?
- 什麼是開放元資料
- '開放' 意味著什麼?(opendefinition.org)
- 為什麼要開放元資料?(參見開放書目原則 @ http://openbiblio.net/principles - 但強度不如此)
- 法律問題
- 法律的預設立場
- 開放許可證
- 技術問題
- 可訪問性
- 互操作性
- 可重用性
- 案例研究:http://obd.jisc.ac.uk/examples
- 技術概述 不同元資料標準
- 來自不同領域的元資料記錄的解剖(3-5 個例子)
- 為什麼會有不同的元素和不同的標準?
- 對電影、藝術品、文學作品等最常用元素的概述
- 對當前可用標準的概述
- 它們的目標、歷史背景、相應的優缺點 + “個人筆記”
- 對不同序列化模式的概述
- 不同應用領域(誰使用什麼)的例子 - 例如帶有螢幕截圖
- 資料整合
- 如何整合來自不同標準的資料,不同標準如何相互互動?例如協議、互操作性。
- 如何理解來自不同標準、不同領域、不同需求的元素?例如詞彙對齊。
- 有哪些工具可用於元資料的發現、識別、定位和去重?
- 例如收藏信託的例子。
- 附錄
- 資源、郵件列表、書籍列表
- 詞彙表
開放元資料手冊適用於
- GLAM 機構:鼓勵他們開放元資料,並幫助他們瞭解在不同元資料標準之間提供互操作性時必須解決的挑戰。許多機構不瞭解其他機構的元資料系統。
本指南將指引他們瞭解所有當前存在的資料。因此,目標不是協調元資料的使用,而是提供有關不同標準如何相互互動的指導。
- 有興趣從文化遺產組織重用開放元資料,但可能不太瞭解其結構的人。因此,手冊必須易於非技術使用者訪問,並對有興趣消費開放資料的非專家有用,他們可能來自各種不同的來源。
- 任何有興趣廣泛瞭解與作品元資料釋出相關的標準和最佳實踐的人。作為教科書,開放元資料手冊應包含案例研究和以百科全書研究為基礎的內容。
- Primavera de Filippi
- Andrea Marchesini
- Jim Pitman
- Karen Coyle
- Claudio Gnoli
- John Mark Ockerbloom
- Owen Stephens
- Pascal Christoph
- Antoine Isaac
- Rakesh Kumar Pandey
鑑於開放元資料手冊已採取的新方向,以下大多數資料現在已過時。但是,它可能包含應納入新指南的有用資料
- 元資料元素:核心元資料元素,用於發現、識別和描述不同型別的作品
- 另見 http://openbiblio.okfnpad.org/metadata-elements
- 元資料標準: 介紹目前可用標準的最新情況,包括它們不同的應用領域(誰使用什麼)以及最受歡迎的標準在書目作品方面的優缺點。
- 另見 http://openbiblio.okfnpad.org/metadata-art 和 http://openbiblio.okfnpad.org/metadata-procons
- 建議: 關於我們認為最適合開放書目目的的標準的結論/建議。這應該以決策樹的形式呈現,不同的資料提供商可以回答簡單的問題,以瞭解他們在交換格式和元資料格式方面的最佳實踐。
- 另見 http://openbiblio.okfnpad.org/metadata-conclusions
- http://wwwsearch.sourceforge.net/bib/openbib.html
- http://www.lib.umn.edu/datamanagement/metadata
- http://standards-catalogue.ukoln.ac.uk/index/JISC_Standards_Catalogue
- http://www.niso.org/publications/press/UnderstandingMetadata.pdf
- http://libraries.mit.edu/guides/subjects/metadata/standards.html
- http://www.bl.uk/bibliographic/service.html
- http://www.w3.org/2005/Incubator/lld/XGR-lld/
- http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/
- http://www.w3.org/2005/Incubator/lld/XGR-lld-usecase/