Table of Contents

書後索引研究日誌 2006-Aug

Aug-1

Aug-2

Aug-3

Aug-4

Aug-8

Aug-15

具體款目與概念款目判準說明

  1. 目的:這是說明區分書後索引款目中,兩種不同類型款目的說明。這個區分是為了進行相關書後索引款目行為研究,對索引款目進行抽樣前所需要進行的分類工作。因為這項研究將主要鎖定在概念款目的編製行為過程,所以這個分類希望能篩選出書後索引款目中的概念款目,建立一書後索引個案研究所需的款目樣本群。
  2. 具體款目:是能指稱具體、特定對象的索引款目。如:人名,地名,機關名稱,書名,文獻題名,特定的標準、格式、表格等。
  3. 概念款目:是說明一概念或是一類型的款目。如:學科專有術語。一個概念款目並不會指定具體事實。
  4. 區分技巧:一個有點小幫助區分技巧,是運用英文文法中的「定冠詞(the)/不定冠詞(a/an)」的區分。當一個款目應該使用定冠詞(the),如「國立台灣師範大學」,便是一個具體款目;若應該使用不定冠詞(a/an),如「綜合大學」,便是一個概念款目。
  5. 這個區分仍然有些限制。例如款目「著作權法」,在一般書籍中可能是指「中華民國著作權法」,但是在智財權或是科技法律的主題中,「著作權法」款目可能是一個概念詞彙,因為可能會有很多不同類型(英美法系/大陸法系)或是不同國家、不同時代的著作權法。特別是英美法系,如美國,是沒有一個特定的「著作權法」的,而是由許多相關的法案所組織起來的。這種模糊情形,也可能反映了讀者對檢索詞彙與編製者對主題詞彙兩者語意上的差距;即,讀者並不一定會按照作者的原義進行檢索。但本研究主要探究的是編製者資訊行為,因此一但注意到這種模糊性,應該對照內文,明瞭編製者原本意圖
  6. 另一個模糊性,是出現在複合詞類款目,如「動詞為首/含有動詞的款目」。如「培養優秀館員」,這很難判斷是否是一個概念?因為這個款目實際上是由三個不同的詞素所構成,即「培養(v)+優秀(adj)+館員(n)」。當複合款目只有(adj)+(n)的結構的時候,基本上還可以視為一個概念,因為形容詞會被當成名詞的修飾或是限制條件。在西文的索引款目中,比較正式的用法應該是用倒裝法,將主詞素倒置在前,如「館員, 優秀的」。但是加上了動詞,讓這個複合款目的理解更麻煩。但基本上,因為這類款目無法指涉一具體事物,因此還是要將之選進被研究的款目樣本群中
    1. 我個人也很懷疑會有人會由「培養」開始檢索款目「培養優秀館員」,畢竟這是個很容易找到同義詞的動詞。但是這涉及到編製者對於索引當初規劃的目的、預期,與其編製過程的許多相關因素。在這個前測個案樣本中,第二層次以後的索引款目,編製者希望反映出的是一級款目的主題知識架構;因此其下的二級架構大部分是源於原本文章中的段落標題。並且,這些二級款目並不會再變成另一個一級款目以被檢索,其標引的頁數也完全包含在原先的一級款目之中。因此,似乎編製者建立此款目的意圖不在於「能被檢索」,而是在於「能呈現知識架構」。這個研究者推斷的論點是需要進一步檢驗的,因此這類的款目最好能出現在款目樣本群中,以進行進一步檢驗。

Aug-16

Aug-21

Aug-22

判準說明修正

  1. 作業中有疑惑時,可討論或詢問。這些疑惑應當紀錄下來。疑惑的發生可能有四種原因:(1)作業者不熟悉判準;(2)判準中與教學時沒有清楚的說明;(3)此判準在理論上不清楚;(4)索引編製者給出有問題的款目。
  2. 若有模糊難以判斷的款目,可畫圈圈出。
  3. 作業完成後請簽名
  4. 第二層款目是否要進行區分:若第一層是具體款目,則其下位款目不須區分。若第一層是概念款目,則其下位款目需要進行區分。
  5. 根據此索引凡例說明,有引號者為直接摘出的句子,不須區分。

理論 Clean Room

研究者在閱讀文獻與理論的時候,像是兩面刃一樣。一方面怕重複既有研究;另一方面又怕受到他人研究結論的影響,或是有研究方法更嚴重的說,污染。我今天拿到一本可能是相關研究的著作,剛剛出版的,所以之前的文獻探討沒有能看到;而我研究已經進行了一部份,要不要看?

因此,我設想出一種類似科技研發領域中 Clean Room 的方法:找指導老師或是其他了解自己研究的學者或研究夥伴看,然後由他們比較這個研究問題與方法過程,中間是否有重複或雷同的部分;但是一定不能透漏任何研究結果。因為即便是一樣的研究問題,不同的研究方法與不同的樣本,也可能得出不同的結論,研究本身還是有一定的意義與價值。但是過早知道相關研究的結論,難免對研究者在作判斷的時候,會有一些心智上的影響。

book indexing behavior grid research 款目研究程序說明

以下只說明 Repertory Grid 部分:

Aug-23

羅素:專名/摹狀詞

Aug-24

Aug-25

Aug-28

詞類 款目數量 佔比 抽樣數量
[c] 47 8.70% 14
[c.domain] 69 12.78% 21
[c+adj] 44 8.15% 13
[c+and] 2 0.37% 1
[u] 133 24.63% 39
[u.domain] 94 17.41% 28
[u_adj] 6 1.11% 2
[u_sentence] 12 2.22% 4
[u+adj] 115 21.30% 34
[u+and] 15 2.78% 5
[u+adj+and] 3 0.56% 1
SUM 541 100.00% 162
Threshold value: 157 抽樣數量以Excel ceiling()函數計算

由於分析第一次抽出結果(15項款目,已廢棄),發現四種主要樣式:(1)由主詞抽出;(2)由條列項目中抽出;(3)既有領域專有詞彙;(4)因為該詞附有英文原文對照而選出。懷疑是否還有其他行為樣式,因此決定擴大到30%樣本比例,重新分析。為了讓excel跑出亂數表,花了幾個小時,結果還是沒有辦法自動亂數抽樣出款目,只好手工一個個由亂數表抽樣。

亂數以Excel Randbetween()函數產生 <csv :data:attic:research:bob-indexing:randen_20060829.csv></csv>

款目詞類分類註記

選出款目(已廢棄)

詞類 位置 款目 上位款目 頁碼
u 394.1 Adaptability 27
u+adj 395.2 Computer Assistend Reference Services 59
u 395.2 Cyberian 193
u_adj 396.1 Educational 129
u+adj+and 404.1 公務人員保障及培訓 223-224
u_sentence 404.1 分析和整理資料的知識 40
u+and 405.2 外匯與投資 286
u+adj 406.1 全文處理(Text Processing)技術 104
c 408.1 自動化館際互借系統 76
c+adj 410.2 青少年兒童讀物 138
c.domain 411.2 電腦線上目錄(OPAC) 查檢資料方式 332
c.domain 413.2 書目中心 51
u.domain 424.1 閱覽性資料 330
c+and 424.1 學術性及大專圖書館 328
u.domain 426.1 讀者服務 28, 51, 53-54, 59, 64, 78, 153, 189, 203, 206, 322, 329, 333

Aug-29

涵蓋一具體字詞[t] 涵蓋一或數個段落[p] 涵蓋一或數個具體章節[s]
由內文字詞[a] 11 13 17
由條列項目[b] 19 23 29
由標題[c] 31 37 41

Aug-30

1)
洪漢鼎(1992)。語言學的轉向。台北:遠流。頁98
2)
洪漢鼎(1992)。語言學的轉向。台北:遠流。頁115-6