Table of Contents

Metadata

Metadata / 有著種種翻譯法,如後設資料、中介資料、詮釋資料、元資料 等。

定義

最簡單的定義是:關於資料的資料。(data about data)。通常會舉圖書館的書目資料作為例子;書目資料是關於書的資料,而書是資料本身,因此書目資料是一種代表書/資料的 詮釋資料(metadata)。其他一些常見的詮釋資料像是描述資料的來源或作者,其取用方式與限制等。

依據Jane Greenberg (2002) 的定義,Metadata是: “structured data about an object that supports functions associated with the designated object.” 即「metadata 是為了支援特定物件的功能性,的關於物件之結構化資料」

此處定義有三項概念定義,一為結構化資料 (structured data),二為物件 (object),三為功能性 (function)。

Coyle(2005)認為 metadata 符合三個必要的特性:

Coyle 觀點中,我認為前兩點值得商榷:(1)例子中,地圖或經緯度,該是屬於data或是metadata?如果說真實世界是第一自然,而針對真實世界的描述是第二自然,那針對描述的再描述,也就是metadata,便是第三自然。地圖與經緯度從這樣來看都是data,人為的第一手資料。當然,這些資料也都符合 Coyle 認為的特徵,即人為建構,與有特定目的性。 而metadata,作為「關於資料的資料」,也當然具備了資料的特性,這是無庸置疑的。

藍文欽(2003)認為引用Greenberg (2002) 對 metadata定義:一組結構化的元件或項目(structured data elemnets),並且從其用途的方面,認為metadata是用於描述物件(Object),作為該物件之representation或 surrogate,並配合其他機制將物件組織成一套系統。

metadata的目的

Metadata的種類

wikipedia(2005)

Gilliland-Swetland (2000)

將metadata分為五種類型:

Metadata 的功能

Dempsey & Heery (1997)從使用者的觀點,認為 metadata 具有五項功能: (1) Location: 定位資訊 (2) Discovery: 揭露資訊 (3) Documentation: 描述紀錄資訊 (4) Evaluation: 評估資訊 (5) Selection: 選擇資訊

Metadata 與編目

Greenberg, J. (2002)認為metadata與圖書館編目工作的相同點在於,兩者都是為了使容易發現資訊與其他功能性目的,而產生的一組結構化的描述資料。

相異之處,在於metadata一方面使用了新的網路技術,如新的編碼語言(XML)等,另一方面metadata利用的情境並不只限於對圖書館內資源的描述的情境,而更發展了各種其他用途與應用。因此,metadata比起圖書館編目,更加強調標準化(standardization)與互通性(interoperability),而更能應用到不同的領域。

Metadata 的要素

Metadata 的限制

metadata是人類為了某種目的,而建構出來的內容。因此,metadata的內容需要符合其預設的目的性,而且是明確的目的性。Gilliland-Swetland (2000)所區分的五類metadata形式,基本上說明了五種不同目的的分野。然而,這也只是一個比較大範圍的區分,建構metadata時,需要更具體的功用情境。

因此,在為了資料輸入成本與資料儲存成本的考量下,metadata可能需要在最經濟的情況下,紀錄合乎目的性的資料,才能讓整個資訊系統有效的運作。

藍文欽(2004)也針對描述性詮釋資料所無法做到的事情,發展了六個「無力論」:

  1. 描述性後設資料得維持精簡的形式(compact or concise format) ,故無法包括物件的所有屬性或面向。
  2. 描述性後設資料以提供與物件有關的事實性描述為主,至於這些描述對讀者代表何種意義,則非描述性後設資料提供者所能充分掌握或預期。
  3. 以文字為主(text-based) 的描述性後設資料,無法充分呈現物件的某些特性,如:圖像、表格、聲音、影像等。
  4. 描述性後設資料中所提供的項目,有些可能是不常用或罕用,使用者常用的項目多集中在少數幾項。使用者在運用這些項目時,不一定會依循後設資料提供者所安排的順序,而是有自己的瀏覽模式或順序。
  5. 不同使用者對描述性後設資料的需求可能不同,不同的資料類型亦需要不同的資料項目,亦即一套劃一的描述性後設資料是無法滿足多樣化的需求。
  6. 描述性後設資料通常是以物件全體作為描述的對象,但資訊求者有興趣的,卻可能是物件中的某部分,是後設資料所不提供的。

Metadata on the WWW

Gill, T.(2000)認為,通行在網際網路上的metadata標準有三種,即 (1)在HTML中的meta tag 如“keyword”、“description” (2)Dublin Core Metadata Initiative (3)Resource Description Framework (RDF).

HTML中的meta tag 如“keyword”、“description” 之所以會有效用,是因為搜尋引擎如 AltaVista 會依賴這類資訊來決定網頁資源與使用者檢索之間的主題相關性,藉以建立檢索排序。這可以說是由作者自行提供主題分析內容,讓資訊檢索系統由此主題分析資訊,來與使用者經由自然語言與切截等檢索語言所表徵的資訊需求資訊,加以比對與排序。不過目前大部分的搜尋引擎已經減少或中止使用HTML中的meta tag來作為相關性判斷的依據,因為網路上出現過多的 Meta tag spamming ,降低整體的資訊相關程度的正確性。

DC (Dublin Core) 用 15個不同的元素欄位來描述一個資訊資源。

Semantic and Metadata

microformat

references