TEI(Text Encoding Initiative

TEI(Text Encoding Initiative)/文件編碼指引
設計目的在於將原始文獻資訊轉換成數位形式儲存。TEI格式主要在處理文字資料的轉換,但也有涉及其他資料格式,如圖象及聲音等。TEI的特色在於能夠描述文獻資料的種種細節與分析,因此TEI的編碼標準相當複雜,但是對於人文學科的研究者而言,其高度豐富性也是這是目前最廣為接受的文獻編碼格式。

基礎班 2

  • metadata 翻譯成後設資訊並不是很好,「上層資訊」比較好,取其「關於資料的資料」之義。metadata 的功能:
    • identification of the text / 識別文本
    • Documentation of its structure and organization / 記錄其架構
    • Documentation of interpretive scheme/s applied / 記錄詮釋性的計畫
    • Statement of rights / 宣告所有權與相關權限
    • Brief characterization for search engines / 為搜尋工具所檢索
  • TEI 的連結(linking): http://www.tei-c.org/release/doc/tei-p5-doc/html/SA.html
    TEI 描繪的連結比html複雜。主要有四種:
    1. <ptr>: 一個宣告連結的空元素
    2. <ref>: 一個宣告連結的元素,需要包含某段文字
    3. <link>: 宣告連結關係的元素,可以在文本的任何地方
    4. attribute <corresp>: 宣告此xml元素與另一個xml元素共通
  • 可以使用Xpath, URI, URL 等機制表達

進階班 2

  • Image Markup tool http://www.tapor.uvic.ca/~mholmes/image_markup/
    Markup TEI metadata for images files. It also can export/import in DocBook format. It's distinbuted in Mozilla Public Licence.
  • 可以在圖檔上標記annotation,此annotation是以svg格式紀錄在TEI xml檔中。即,此檔同時使用TEI 與 SVG 兩種namespace。 除了描述之外,選「建立web檢視」時,Image Markup tool 會建立四個檔案:xml資料記錄,xsl格式轉換,css 與 js,以此建立web的瀏覽器檢視。