Indexing books / Mulvany (1994)

Citation - Mulvany, N. C. (1994). Indexing books. Chicago: The University of Chicago Press.

Keyword - indexing, index, back-of-the-book_index

這本書成書於1994年,書寫時間當在此之前;可以說是在Google衝擊資訊檢索工作之前。

Ch.1 Introduction

Index 定義

  • ANSI Z39.4-1984
    • a systematic guide to items contained in or concepts derived from a collection. These items or concepts are represented by entries arranged in a searchable order, such as alphabetical, chronological, or numerical. This order is normally different from that of the items in or concepts in the collection itself.
  • BS 3700:1988 (British Standards Institutions)
    • a systematic arrangement of entries designed to enable users to locate information in a document.
  • Mulvany (1994) 不但要求索引需要周密完整,還是一種主題指引的知識架構。姑且不論這種要求是否太過嚴格,對大部分索引編製者而言,這個倒是一個不會加以拒絕的終極目的。
    • An index is a structured sequence– resulting from a thorough and complete analysis of text– of synthesized access points to all the information contained in the text. The structured arrangement of the index enables users to locate information efficiently.
    • The value of an index lies in how it is organized. While a poor index may contain references to all the important information in the text, if it is not systematically organized for easy access, such an index has limited value to the user…. Readers trun to an index with a very specific purpose, to locate information about a topic.

Indexing principle

根據 BS 3700:1988 標準,有索引有以下功能(編號為作者所加):

  1. Identify and locate relevant information within the material being indexed.
    以索引標明資料內的相關資訊
  2. Discriminate between information on a subject and passing mention of a subject.
    區別主題資訊與只是略提到主題的資訊
  3. Exclude passing mention of subjects that offers nothing significant ot the portential user.
    排除只是略提到主題的資訊
  4. Analyse concepts treated in the document so as to produce a series of headings based on its terminology.
    根據其用語,分析文件內的概念以

產生主題標題

  1. Indicate relationships between concepts.
    標明概念間的關係
  2. Group together information on subjects that is scattered by the arrangement of the document.
    將散佈在文件內的概念歸類聚集
  3. Synthesize headings and subheadings into entries.
    將標題與次標題綜合為款目
  4. Direct the user seeking informaiton under terms not chosen for the index headings to the headings that have been chosen, by means of cross-references.
    讓使用者透過詞彙的資訊檢索,而非透過索引的標題。即,透過互見參見機制
  5. Arrange entries into a systematic and helpful order.
    以系統且有用的順序排列款目

Audience

  • 作者區分兩種讀者:讀過整本書的,與沒有讀過的。整本書讀完的讀者,能熟悉作者的用詞語彙。若要符合第二種讀者的需求會較為困難,因為讀者與作者所使用的語彙並不相同,並且每個讀者也不盡相同。作者假定,參考工具書的讀者是屬於第二類的。
  • Specialized subject knowledge: 一些書籍預設了讀者的背景,認為讀者具有特定的主題知識。這類的書籍,較容易確定讀者的語言需求。
  • 讀者使用索引的方法: 作者區分兩種讀者使用類型: (1)休閒的讀者; (2)急切的讀者. 作者各舉出食譜與電腦設備使用手冊作為例子.
  • 理想的索引: ASI(American Society of Indexers) 年鑑索引競賽的評比標準,中的兩個部分: “索引內容”與“索引款目的結構與正確性”:
    1. Content of the index
    2. Structure and ccuracy of the index entries

術語

  • Main Heading / 主標題 :
  • Subentry / 次級款目 :
  • Reference locators / 標引位置 :
  • Cross-reference / 參互見 :
  • Entry / 款目 :

Ch.2 Author and Index / 作者與索引

  • 不論作者自編索引,或是委由專業索引者編製索引,一些預先準備工作都會讓後續的索引工作更容易進行。

book contract and index / 書籍(出版)合約與索引

  • 在一般的美國非小說出版合約中,作者通常被認為需要提供索引。如果作者沒有能力提供索引(不論是時間上或是品質上),出版社會協助作者製作索引– 當然這些成本會根據作者的版稅收取費用。這項條款考量的是,作者本身通常不會詳細檢查索引。對某些書來說,索引會直接影響書籍銷售。對合約的雙方當事人來說,能有最好的索引都是有利的。
  • (本書作者認為)不論索引是否要由作者自行編製,書籍作者與出版社應該在合約上共同分擔索引的成本費用,而作者部分的費用應該由後續的版稅所支付。
    • 英國期刊 Indexer 於1988年的一篇文章「Contracted index (索引合約)」中,報導英國作者工會(The society of authors and the writer's guild of Great Britain)已經與數個英國出版社達成協定,認為索引的成本應該由作者與出版社五五分帳。
  • 一段由作者編製索引的悲慘過程。作者一開始覺得編索引沒什麼,但是花了意外多的時間而沒有成果,最終出版社只好找到索引編製者接手,以趕上出版時程。然後作者被索引委外編製的高昂成本所震驚。通常300頁的書本,急件的索引編製的費用接近千元(美金,約三十萬台幣左右)。某些出版社會幫作者向索引編製者砍價,因為作者很難出這麼一大筆錢。不過話說回來,作者要獨自負擔這筆費用,通常是受制於一開始合約的限制。(p. 17-18)

writing process and index / 書寫過程與索引

  • 寫的好、編的好、有結構的書會較容易編製索引。
  • 有些清單在寫作時候先準備好,會省下未來索引編製的問題:(p. 18-21)
    1. 人名
    2. 機構/組織名
    3. 地名
    4. 控制詞彙(controlled vocabulary): 確定同義異名的詞彙,對建立「見/參見」的款目有用
    5. 決定索引編製的範圍: 是否包括註腳、附錄等

who should prepare the index / 誰應作索引

應該由作者或是專業編製者來編製索引,一直是一件長久以來的爭議。

  • The Chicago Manual of Style:
    • 13th edition: “the author must nearly approaches the ideal as indexer(18.20)“
      作者是最理想的索引者
    • 14th edition: 增加了一些但書。最好的學術性索引是由有能力客觀看待其作品的作者所編製的,他們也知道什麼是好的索引,如何製作出好的索引。但是不是所有作者都有索引編製的技藝或是經驗,這個時候導入專業索引者參與編製工作,是製作出適當的索引的最佳做法。
  • 贊成專業索引編製者的證言:
    • John A. Vicker (作者,年度最佳索引獎 Wheatley Medal 得主): 「的確,通常的情況作者是最不適合編製自己作品的索引,因為他太了解文本了(too close to the text)。」
    • Hans Wellisch (p.21-22)
  • 作者也是讀者之一

作者編製索引的優缺點

  • 優點:
    1. 作者最熟悉文本與主題;
    2. 作者最了解什麼是這本書想要對讀者訴求的;
    3. 作者最希望能有好索引,以幫助銷售(教科書為例)
  • 缺點:
    1. 作者缺乏索引編製過程的知識;
    2. 疲憊,與過多自我牽扯(self-involvement)

索引學習的困難

(本書作者 Mulvany 認為)索引編製過程並不是一件容易學習的工作。在他教導上百個學生索引編製技巧的經驗中,他發現只有少數人能掌握索引編製的技藝。即使經過了30小時的室內授課,加上至少30小時的課外準備時間(在台灣約是一學期,共15周,每週2個小時的課程;一學期的選修課程),有些學生能夠學到規則,但是仍然不能作出適當的索引。另一些學生在選詞階段有不錯的概念化工作,但是在規則的部分弄得一團糟。(p. 22-23)

Hans Wellisch 用學習小提琴來比喻索引編製的學習,只有少數能變成大師。

[XXC]: 索引編製的境界,也許到藝術的層次上,包含了許多專家的內隱知識。用書法來比喻也許是很適當的:到底書寫的目的是為了美感價值,還是表達與傳遞資訊的價值?如果將問題放在傳遞資訊的工作上,內隱的技藝知識的部分是否還存在?這是一個完全不同範疇的問題。因為這兩個內隱知識的問題,是瞄準著不同的知識內涵。

專業索引者編製索引的優缺點

  • 優點:
    1. 有經驗
      • 熟知索引編製程序
      • 索引專案的時間管理
      • 熟知出版格式
    2. 客觀的檢視書籍內容
    3. 特定領域的專業索引者,具有特定領域的專業知識
  • 缺點:
    1. 不熟悉主題內容。但這對大眾市場導向的書籍並不是太大的問題。

relationship between author and indexer / 作者與索引者的關係

  • 找到索引者。此段對台灣現況無用
  • 索引合約。此段對台灣現況無用

需要提供索引者的

  1. 完整書籍的最後樣張。(某些情況下這並不是最好策略,甚至無法再索引一開始就得到。電腦出版技術的發展也使得此項要求不盡合理。但是就權責而言,這是出版者必須提供的)
  2. 索引的出版樣式規格說明。(編輯)
  3. 若有,作者能著作內的「人名、地名、機構名稱」清單

索引者與作者的合作

  • (作者 Mulvany 認為)作者能與索引編製者合作會很好,不過作者提供詞彙清單會造成索引編製這困擾,讓索引編製者搞混編製的原則。最好作者能等編製者編完以後再與編製者一同校對缺漏的詞彙。(XXC: Mulvany 實在太站在索引編製者著想了;作者如果有這個耐心與功夫再去指出缺漏的部分,早就自己編索引了。)
  • (作者 Mulvany 認為)由作者勾出頁面裡面的重點詞彙的做法,不可取。因為(1)侵犯索引編製者選出詞彙的權利,要就全部照索引編製者的,要不然就換人;(2)不同人選出的詞彙會有不一致性,破壞索引的「韻律」;(3)干擾索引編製者的閱讀。
  • 中期檢查(interim review): 除非索引很大,作者與編輯不應該用中期檢查打擾索引編製者。
  • 最後檢查(final review): 最後的成果要經過作者與編輯檢查。作者應該盡快,在一兩天內,完整的檢查完索引。
  • (XXC: 原則上,Mulvany 認為索引編製者應該不受打擾的獨立工作,就像藝術創作者一樣;作者的協助只是作為他免費且必要的諮詢。並且要一兩天之內完整的檢查完索引,幫索引者背書,好拿給編輯,才不會延誤到出版時程。真是任性又獨裁的編製者啊。Mulvany 的態度強硬,很難想像這是一種與作者平等的關係。看這幾段的時候感覺不是很好,也許專業有時候看起來就是一種架子。)

Ch.3 Getting Started

the natrue of indexing work

一般索引者的工作程序:

  • 許多專業索引者在樣書定稿之後才會開始編製索引。一般書籍編輯的過程有:
    1. copyediting / 編輯稿
    2. author review of copyediting / 作者檢查編輯稿
    3. clean up copyediting / 整理編輯稿
    4. galley production / 製作校樣稿
    5. authour proofreading / 作者校對校樣稿
    6. page proof production / 製作清稿
    7. proofreading and indexing / 校對與編製索引
  • (XXC): 作者強調編輯過程中的三個階段,認為索引編製者應該在最後確定的階段才開始進行索引編製。這個原則可能在電子出版的環境下有些不同,也可能與索引編製者所使用的編製工具有關。

how indexers work

  • 索引編製的方法,隨個人與其專案皆有不同。
  • 索引者閱讀的方法與一般讀者不同。索引者閱讀文本的方法:
    • 與為了興趣的閱讀不同,索引者一方面要盡快的閱讀,另一方面也要精確的綜合文本。
    • 有良好寫作架構的書,在閱讀的時候很容易浮現出索引詞彙。例如,一本C程式語言的參考指南,會遠比海德格的《存有與時間》容易製作索引的多。
      • 《存有與時間》雖然也很有結構,但是書中處理的是複雜的概念。
    • 索引者需要將自己融入作者的語彙。
    • 索引者同時也要考量到讀者的需求,並且辨識出含糊概念間的細微差別,以作出互見的款目。
    • 索引者閱讀的強度與一般讀者不同。
  • 記憶
    • 許多索引者用腦袋記住整本書的索引的架構
  • 索引者需要能辨識出細節,並且將這些細節以有意義的秩序連結起來。
  • 索引者需要能綜合資訊,使讀者能了解這些綜合的概念。
  • 索引者要作讀者與作者的中介者。
  • 300頁的書通常需要3周時間索引。

the book production process

what not to index

  • front matter / 正文前 - 通常不列入索引之中
    • 題名頁、版權頁、目次、圖表目次、提獻詞、感謝頁等,一般不會被索引
    • 前言、序言:通常內容是關於出版緣由事宜,不會被索引。簡介:與主題有關,可索引
    • 正文前的頁碼與正文頁碼的區別
  • content / 正文 -
    • 本文通常是索引的主要部分
    • 章節一開始部分,若有提供「提要、章節目次」等,不需被索引
    • 教科書的章節後附的練習與問題:通常不被索引,但是非「絕不」
    • 只提供參考書目的「頁尾註(footnote)」與「章節註(endnote)」通常不需被索引。
  • back matter / 正文後 -
    • 附錄、詞彙表(glossary)、參考書目(reference),通常不會被索引
    • 但是可以在次級款目提供主款目的相關資訊

what is indexable

  • 本文
    • all information presented in the body of the text that is directly relevent to the subject matter, scope, and audience of the book is indexable.
    • 索引者需要判斷,哪些只是「提及」索引款目,那些是與款目的主題相關。
    • 相關資訊的判斷:
      • 顯性的相關資訊,如:人名、組織名
      • 隱性的相關資訊,由索引者判斷
        > Implicit information is that which is implied but not stated word for word in the text. Quite often, genernal concepts are implicit information that must be identified by indexer. (p. 45-46)
    • > It is reasonable and experienced application of judgement and interpretation by the indexer that greatly contributes to the overall quality and usefulness of an index. It takes a trained and experienced mind to realize that just because a term is mentioned does not necessarily mean that the mention is important. (p. 46)
    • 索引者:過濾掉不重要的資訊;找出隱含的主題資訊
  • 頁尾註(footnote)、章節註(endnote)
    • 只是提及書目資訊的註解註腳,通常不需要被索引
    • 有時註腳會提供參考資訊內容,如:法律條款,則可被索引
    • 註腳提供重要資訊時
  • 圖表
    • 索引編製前,需決定需要被索引的資料類型,是否包含文字類型以外的資料
    • 不同類型的資料,需要不同的款目格式

how to index the indexable material

  • depth of indexing / 索引深度
    索引所呈現細節的程度,當索引越詳盡,越明確具體的時候,索引深度也越大 (Wellisch, 1991:122)
The effectiveness of any content analysis or indexing system is controlled by two main parameters, indexing exhaustivity and the term specificity. Indexing exhaustivity reflects the degree to which all aspects of the subject matter of a text item are acturally recognized in the indexing product. When indexing is exhaustive, a large number of terms are often assigned, and even minor aspects of the subject area are reflected by the corresponding term assignments. The reverse obtain for nonexhaustive indexing, in which only main aspects of subject content are recognized. Term specificity refers to the degree of breadth or narrowness of terms. (Salton, 1988:227)
  * exhaustivity / 詳盡性
  * specificity / 明確具體性

* Term selection / 選詞

  • 以讀者的角度組織詞彙
  • alphabetic order的時候,將主要被檢索的詞放在款目前方,使讀者可以依序檢索得到
  • Readers conduct their search for information at the main heading level.
  • manipulation of terms / 詞彙修改
  • 簡潔清晰的款目 / Succint and clear entries
  • 由書名,或本書主題取得的款目
  • 通常這類款目對本書而言,會太過廣泛,以至於不具有索引的功能
  • marking the page proofs / 在頁面劃記
  • 優點1:在編輯程序中,在頁面標記可以容易標示(locate)出款目的上下文脈絡
  • 優點2:如果頁面已經有頁碼,可以幫助檢查款目與頁碼是否正確
  • 目的:標明每一頁的文本中的可能索引款目
  • 每個索引者會使用自己的速記標示(shorthand notation)來劃記索引款目
  • highlight 特定類型的詞,如:人名

interpretation the publisher's instuctions

索引工作開始前,索引者要先了解出版社對索引的期望。出版社的要求可以歸納為兩種:

  1. 與出版社的出版樣式一致
  2. 索引的長度(頁數)

出版社的索引樣式

每個出版社都會有不同的索引樣式,基本上可以大略將索引樣式的要求區分為:

  • 主款目排列的方式 (中文通常用筆劃筆順,現在通常透過電腦處理)
    • letter-by-letter
    • word-by-word
  • 次款目排列方式
    • alphabetic
    • page-number order
  • 款目表現的方式
    • run-in / 接續式,主款目下的次款目接續在主款目後排列
    • indent / 縮格式,主款目下的次款目換行縮格排列
  • 表現頁碼的方式
    • 完整的,如:234-239
    • 縮減的,如:234-9
  • 表現參互見的方式

估算索引頁數

Ch.4 Structure of entries / 款目結構

索引一方面有超連結的性質,另一方面也具有階層式的結構

  • 選擇標題
    • 主款目通常是名詞,或是經過形容詞修飾的名詞。形容詞或副詞不能作為索引的主款目
      Main headings are often nouns, or nouns preceded by an adjective. A main heading should never be composed of an adjective or adverb standing alone. (p. 71)
    • 索引者被告誡要避免在書後索引中使用分類表
      … however “logical” or “natural” a classified arrangement in hierarchical form may seem to be to the classifier, it may not be so to other people who are not privy to the principles of division or subdivision employed by the maker of the classification. (Wellisch, 1991:39)
      • 分類表常用在期刊或是資料庫的索引中,因為分類表能確保龐大且不斷成長資料的主題某些程度的詞彙控制。
      • 分類式標題的用法
  • double-posting / 複式著錄
    • 同一個款目概念,以不同的形式著錄在兩個地方。即,在索引系統中針對一個概念資訊,同時有兩個或以上的檢索點(access point)。
    • 考慮到,讀者可能採取一種以上的途徑取用資訊,因此需要雙重著錄。
    • 複式著錄(double-post)一詞是由簿記(bookkeeping)而來的。複式簿記(double-entry)會計系統要求紀錄同一筆款項兩次,一次記在借方,另一次記在貸方。
    • 優點:提供讀者多重的檢索點,因此更容易找到資訊。
    • 缺點:(1)增加索引的版面空間;(2)因為複式著錄需要重複相同的資訊,因此一但整個索引有許多複式著錄,會增加編製者發生錯誤的機會。
    • 許多索引編製者在編製初期的著錄階段,以「見/參見」的方式著錄同義異名款目;到編輯階段,索引編製者才考慮是否將同義款目以複式著錄的方式呈現。
  • subentries / 次級款目
  • 主標題與次級款目的形式
  • reference locators / 指引 (頁碼)
  • cross-reference / 見與參見

Ch.5 Arrangment of entries / 款目排列

Ch.6 特別考量

  • abbreviation and acronym / 縮寫與首字母縮略字
    用見與參見的方式處理
  • 大小寫
    中文沒有這個問題,排列上先大寫後小寫
  • 非英文字母 (略)
  • 數字、符號、與其他非字母 (排列問題,略)

multiauthored works / 多作者作品

(p. 144-145)

  • 多作者作品有數種類型。由索引編製的觀點而言,最簡單的多作者作品就是作者間已經有密切的協同工作、編輯、討論的過程,使作品的內容呈現出一致的論述。這種多作者作品的索引編製過程類似單一作者作品。
  • 另一種作品大多出現在某個專門領域的作品中,由各個作者各自闡訴,也有個別的編輯過程。例如,特定主題的論文集,研究所階段的教科書,以及研討會發表論文集等。
    • 這種多作者作品最主要的問題是詞彙控制(vocabulary control)。即便集結作品的主題非常特定,每一個作者仍然會使用不同的語彙以描述相同的主題。索引者必須仔細的確認同義關係,並將相關的資訊集中在一個詞彙下。如果沒有謹慎的詞彙控制,索引中的資訊將會零落分散。
    • 作者在此建議,較好的同義異詞關係處理方式,應是以參見將同義詞彙相關頁碼集中到一個主要款目上。
    • 通常多作者作品的內容較為稠密。為了詞彙控制,索引者應要克制,避免在初期索引工作作了過度的複式著錄(double-posting),而保留在編輯的階段處理。當索引編製者預估到會有詞彙控制的問題,應當在工作中考慮的是如何集中相關資訊,而非讓自己陷入資訊分散的危機中。集中相關資訊之後,複式著錄會更容易進行。
    • 論文集內容通常是高度技術性的,包含了最新的理論,研究與術語。理想上,索引編製者應該要很熟悉這個學科的語言,才能有效率的處理這類專業技術內容。
    • 有些編輯會提供索引編製者,經過作者標注出關鍵字的稿件,表示作者認為這些詞彙應該要出現在索引之中。與單一作者的情況相較,多重作者所提供的標注稿在索引編製工作上能發揮的作用較小,因為缺乏詞彙控制;有的作者標注的太細,有的作者標注的太少。
  • 研討會論文集的做法。作者提到,最近有些研討會,在會場上已經提供了印製好的論文集。雖然不多,但是有些論文集也會附有依照alphabetical排列的主題索引。這些索引是由作者提供自己論文的索引詞彙,然後研討會單位再集中這些詞彙,對到正確的頁碼。作者認為,這種索引比什麼都沒有做好,並且也滿足了對多重作者作品足夠的主題索引編製需求。

multivolume works / 多冊作品

Ch.7 Names, Names, Names / 名詞(修詞)

Ch.8 Format and Layout of the Index / 呈現格式

Ch.9 Editing the Index / 編輯校對

Ch.10 Tools for Indexing / 索引編製工具

manual methods

3x5 index card method

  • The procedure:
    1. writing entries on the cards / 於卡片上繕打款目
    2. alphabetizing the cards / 依字母順序排序卡片
    3. editing the cards / 編輯卡片
    4. typing an index manuscript form the card / 由卡片撰寫索引稿
  • style guides: Chicago(1982)
  • writing cards
    • written by hand or typewritten
    • each card usually has only one index entry
      • an index entry refers to a main heading, subentry, and reference locator,; or a main heading and cross-reference.
    • use filing boxes or shoe boxes hold the cards. a several feet long boxes will be needed in a book-length index, which may require several thousand index cards.
  • edit cards
    • editing entries
    • reorganization and rearrangement of the entries
  • type the index manuscript

the text file method

  • the entries are typed into a text file. Subentries are placed under main headings and indented, usually with a tab character.
  • drawbacks:
    • term selection and perform alphabetizing at the same time
    • as the file grows too long, moving from the end of the file to the beginning of the file to insert a new entry in the verious sections of the aplyabet can be quite tedious.
  • benefits:
    • availability of common word processing tools
    • the index can be printed in manuscript form at any time
    • no separate step required for typing the index manuscript.

automatic indexing