The concept of information / Capurro & Hjorland(2003)

Citation - Capurro, R., & Hjorland, B. (2003). The concept of information. Annual Review of Information Science and Technology (ARIST), 37, p343-411.

Keyword - information

by 陳怡華、辜威仁、鄭小祺 http://www.xxc.idv.tw/mt/archives/knowledge_sociology/002023.html

How to Define a Scientific Term

Information的概念是人們經常使用的概念,就溝通知識而言,information的概念在當代社會扮演了很重要的角色。一般認為 information也是經濟發展的基本條件之一,就如同資本、勞工、原料等,但令information特別顯著則是在於它的數位特性。資訊科技對於自然及社會科學的影響使得這個人們常用的概念變成引起爭論的概念。

這一章的內容主要是回顧在information的概念在Information Science領域所扮演的角色,同時也參酌各學科間對於information的概念之看法。一開始我們會從哲學的角度來探討如何為一個term下定義,另外也會探討一個字的歷史源起,以便更了解這個複雜的概念。同時,探討其他學科對於information的概念也是很重要的,因為Information Science裡許多理論及方法都是起源於他處。而且跟information相關的名詞,如:文獻、文本、知識也是不容忽視的。

基本上,定義沒有對錯之分,只有內容豐富性之差異。人們可依其喜好隨意定義名詞,但事實上他們的定義可能是有問題的。例如:小孩玩遊戲時可能會將椅子認定為是桌子,只要小孩子同意這個說法,決定了此一概念之定義,對他門而言這個定義就成立了,但外界的人可能無法理解該定義,因此若有人對某一個名詞下很獨特的定義,該定義可能會被忽略也無助於理解或溝通。因此了解不同人對於information的用法有助於更了解 information的概念,Wittgenstein著名的意義的使用理論便強調一個term的定義由其在使用該語言的社會中的用法而決定的,但terms實際運用的定義可能與表面上、常用的定義不同,外顯的科學定義可能與一般使用的內含定義相互矛盾,因此不能只比較不同的表面定義,要考慮其相關用詞的意義,如 information seeking、information system、information service。 Charles Sanders Peirce認為一個term的意義不只是由過去決定,也攸關未來,例如: net,在資訊科技未發明以前,其意義只是單純的網子,但在現今的網路時代它則有網絡的意義。

科學活動的展現在於知識的生產以及科學理論的發展,而terms的意義應視為其理論的架構。哲學家Chalmers認為陳述觀察結果一定要用理論裡的語言文字來表達,因此理論裡的概念及陳述就會跟該理論一樣精確、有意義。因此自然科學理論的概念會比社會科學理論的定義來的清楚,例如:牛頓力學裡質量(mass)的概念,可利用公式來解釋,會比社會理論中民主 (democrary)的概念來的清楚。他也提出兩種定義科學術語的方法,一種是語彙 (Lexical)定義,也就是利用其他概念來定義一個概念,但此方法有個問題,若不了解概念的意義,用概念解釋概念只會造成無限的迴圈,除非設法弄懂用來解釋的概念。 另一個是例證 (Ostensive)定義,意即利用實例來定義一個概念,但此方法也有個問題,因為概念有時是很難舉實例證明,例如:力學的質量、電磁學的電場。

Chalmers也指出概念的出現通常起始於一個模糊的想法,之後逐漸澄清該模糊的想法才成為理論,而在理論中概念會以較精確且一致的形式呈現,而理論的形成通常比驗證理論更為困難,例如:伽利略花費在構思力學理論的時間,比用實驗去驗證其理論的時間多很多。

根據Chalmers所言,terms的科學定義是根據它(如:information)被用於何種理論。而Spang-Hassen提出 information並非專業術語,可能是當無其他正式定義時會常被拿來用或是有些人認為多加information這個字會有利於提升其專業地位,因此很多人會利用曾在其他較專業領域被利用過的字,如:工程學裡的information,來提升其專業地位。但這種做法會有其風險,因為這個字的定義運用在其他領域有可能不像在原本領域那樣專業,而且加了information這個字可能會讓原本的概念變模糊,造成內部混亂,例如:information center所要意指的其實是圖書館,但用了information center讓人無法直接聯想到圖書館。採用具說服力的定義(Persuasive Definitions:讓人留下深刻印象的用法及定義)亦是危險的,如:Brooks的資訊科學的基本方程式 K[S] + ▲I =K[S+ ▲S],因為通常一個字會有多種定義。

Schrader認同Spang-Hanssen的說法,他研讀了1900~1981年約700個對Information Science的定義發現,Schrader(1983) 發現Information Science文獻的特徵是概念的混亂,而起因是由定義Information Science的文獻引發的各種問題,如:對於先前的定義不加以評鑑就直接引用、過分追求科學地位、忽視沒有科學或科技標籤的文獻…等。

若要了解information 的概念在Information Science究竟該扮演什麼角色?我們必須先弄清Information Science領域的科學理論的角色及特性,而著重在signs, texts, knowledge的概念也可提供Information Science的概念架構。 再者,在Information Science領域,務必要謹記對接收者有意義的才叫information,而是否有意義則是依每個人的需求及闡釋技巧而不同。

通常研究一個字的歷史,etymology(詞/語源)並不是最重要的,因為etymology僅意指真實的意義(構成及使用的根據),無法看出不同用法之間的相互關係,如:隱喻、換喩。而藉由詢問現代用語、深入探討符號、意義與參照之間的關係、及注意歷史情境轉變將有助於了解字詞現在及未來對於的用法是如何交錯使用。在更深入探究information 之前,我們應該先了解兩個information的脈絡,一個是molding(塑造)心志的動作,另一個則是溝通知識的動作。

歷史重要的背景有助於了解higher-level(概念的根源是low-level的實際使用)的information概念,因此我們有必要從information的拉丁文字根及希臘雕像希臘文起源進行探究。我們可以從information兩個不同使用情境進行探討,一個是Tangible (有形)的情境,另一個是Intangible (無形的)或Spiritual(精神的)情境。

  1. Tangible (有形)的情境,如:
    1. 古文informatio字首的in原意是“否定、不存在“,但也可以解釋為“給某樣東西一個形式的動作”,如古羅馬詩人Virgil的詩中在描述火神鍛造盾給特洛伊戰爭中的勇士Aeneas。
    2. 古文informo也可用於生物學情境,如:Varro 描述如何利用頭及脊骨來判斷是否有胎兒。
  2. Intangible (無形的)or Spiritual(精神的)情境。偏重於道德及教育的使用。如:
    1. Tertullian稱Moses為populi informatory,意即摩西是人們的教師或命運的支配者。
    2. 希臘字hypotyposis及prolepsis是由拉丁字informatio、informo翻譯而來。Cicero(西塞羅)對於prolepsis概念的解讀是未親身經歷之前,我們對於上帝或事物銘記在心的印象。
    3. Augustine(奧古斯汀)稱視覺感知的過程為 informatio sensus,他認為人類感知到物體的影像或印象後會儲存在大腦的記憶中,但其影像或印象本身是無意義的,必須透過人類官能的內部處理才能顯現其意義。

由以上的例子可得知在中古世紀,informatio、informo常被不同作者用於認識論、本體論或教育的情境。

到了現代及後現代information 的用法有所改變,例如:在德國,information 這個字從15世紀開始實際被用於教育與溝通。 從Descartes(笛卡兒)的“forms of thought(思想形成)”,可看出Information定義從中古世紀的形塑事物改變為現代的與某人溝通某事。笛卡兒的思想形成主要內涵是要將想法成為頭腦裡的一部分,而非只是呈現在頭腦裡的某些地方。

1988年Peters重申原由笛卡兒所發展出來的“doctrine of ideas”,對於現代哲學的理性主義者及經驗主義者都是很重要的。笛卡兒在Intellect(理解力)跟Nature(天性)之間插入”ideas (想法)”,所謂的idea是呈現在心中的某樣東西、一個影像、範本或表徵,這些都跟現實世界的真實東西有關聯。然而,到了20世紀資訊理論的興起,導致Information的概念不再是Higher-level的概念,在Bacon的”Great Instauration”裡就提到information必須是由一個可在錯誤中區分出正確的所產生的。因此,我們推論現代對於Information的使用是個轉折時期,並未摒棄中古世紀形塑事物的實體概論,而是在經驗及認識論的前提下重塑。

Information as an Interdisciplinary Concept

上面提到「資訊」到底是什麼,這個問題除了在每個人有不同的定義,在不同學科社群也有著不盡相同的定義與意義。更不能如Machlup在 1983年所說的“to telling something or to the something that is being told.”這麼簡單。因此,身為一個圖書資訊界的相關人員,如果無法先去了解知識的前身-資訊為何物,又豈能奢談做好知識管理及服務的相關工作呢。

根據Machlup(1983, p. 660)的發現,他指出如心理學、經濟學、決策理論以及語言學等人文科學所採用的一般人類相關的意義,包括了以下幾點限制:

  1. 所謂的「事實」或「正確」應該排除虛假或錯誤的訊息;
  2. 「有意義」或「有用的」不包括對決策或行動沒有幫助的訊息;
  3. 「新奇的」意指不包括重覆或多餘的訊息;
  4. 所謂的「意外」不包括接收者預期收到的訊息;
  5. 能「減少疑惑」指的是排除讓使用者增加不確定性或停留在不確定性的態度;

這些條列式的定義看似嚴謹、明確,然而我們能為「資訊」條列出它所有的定義嗎?如果可以,我們今天也不必在此繼續探求資訊為何物了。過了不久,Machlup又說「資訊」是一種和人有關的現象或事物。它包含了個人在行動脈絡中所傳遞和接收的訊息。然而Ralph V. L. Hartley(1928, p.536)在“Transmission of Information”中卻以電力傳輸系統為例,指出希望去除心靈上的因素,去建立一個具有純粹數量化的「資訊」測量方法。到了這個地方,我們可以發現人文科學與自然科學這兩個不同學科對「資訊」這個概念的差異。對其他人來說,資訊並不是一種有形或無形的框架,而是呈現出一種趨向於某種程序與進展。(Tize, 1971)另一種看法是資訊是在認識論的脈絡中涉及科學知識產生的主要概念。(Oeser, 1976)

以自然科學對於資訊的概念來說,首推Claude Shannon提出的傳播模式,他指出資訊傳播模式包括了六個基本要件,從資訊源、編碼者、訊息、通路、解碼者到接收者。(見下圖)在這裡我們可以發現「資訊」是當作被分解成訊息而傳遞的物質,甚至在傳遞的過程中,還必須考慮熵(Entropy, Noise Source)所造成的干擾。但是在這裡,尚未討論到資訊對於收發者兩端的意義為何。

然而根據Mahler的說法,他指出「資訊」是一種情境式的概念,如果要問資訊是什麼?我們就不能不依據當時的情境來判斷。但是這種說法似乎過於籠統,而無法讓「資訊」有一個放諸四海皆準的定義。在Weizsäcker的觀點來說,他對「資訊」的雙重範疇說明如下:

  1. 能被理解的即是資訊
  2. 能產生資訊的即是資訊

此外他補充說,「資訊」的意義在人類這個層級來說就是一種概念,而不是思考的過程,而「資訊」的兩個條件是:

  1. 資訊是語言的實體
  2. 資訊是單義的(意義明確的)
  3. 最後他說,並沒有所謂絕對的資訊概念存在。

相對於自然科學界對資訊的觀點,人文及社會科學界對資訊的概念也有許多不同的看法。在1990年Israel與 Perry提出了純資訊(Pure Information)與增量資訊(Incremental Information)的觀點,並以此舉了一個有趣的例子:他們指出,所謂的純資訊(Pure Information)就像是X光,只是純粹的去反應出物質;而增量資訊(Incremental Information)就如被X光所投射出來的物質。例如用X光去照射一隻斷了腿的狗,我們看到經由X光所照射出來的狗斷腿,就是一種增量資訊。因此我們可以這麼說,諸如語言、媒體等皆是純資訊,而藉由其反映出來的意義才算是增量資訊。

另一方面,Braman(1989)曾經針對政策決策者提供了四種資訊的主要觀點:

  1. 資訊即資源
  2. 資訊即商品
  3. 資訊即模式的認知能力
  4. 資訊社會裡的組織影響力

從這四點來看,擁有較多資訊的人是否也相對擁有較多的資源與影響力,這一點應該是無庸置疑的。

從知識管理的觀點來說,「資訊」被用來當作是具意義資料的獨立片段,在組合於情境脈絡之後,就組成了知識。(Gundry, 2001)這一個觀點與圖書資訊學常探討的知識生產過程相吻合,即資料產生資訊,資訊產生知識,知識凝聚成智慧。 當我們陷入追求「資訊」定義的無底洞時,Eliot(1969, p.147)提出了發人省思問題:

  1. 在生活裡我們所失去的生命意義到哪去了?
  2. 在知識裡我們所失去的智慧到哪去了?
  3. 在資訊裡我們所失去的知識到哪去了?

在探討了各學科對資訊不同的定義與觀點後,我們回頭來看Eliot所提出這三個問題,是不是能讓我們對於「資訊」的概念有了更深一層的領悟,是不是能讓我們跳脫出「資訊」帶給我們的無形束縛,而以更廣大的視野來探討「資訊」到底是什麼?而不是拘限在各學科既有的框框裡。

Information in Information Science

既然不同的學科對於information一詞的定義各有不同,那麼information使用在資訊科學的領域中又有著什麼樣的意義呢?

1968年,American Documentation Institute 改名為American Society for Information Science,從此,information一詞逐漸取代了documentation,只剩下少數的機構還保留著documentation一詞。 Hjørland (2000) 指出information一詞使用在圖書館與文獻機構上增加的趨勢,主要與下列二點有關:(1)對電腦應用或資訊科技的興趣、(2)信息論與認知科學中資訊處理範例的間接影響,但這樣的趨勢有一個缺點,對於電腦科學而言適當的理論對圖書館科學,文件,和科學的通信不一定是最合適的,將會使文獻學的研究轉向為電腦科學,而喪失了這個領域自己的基礎。一般來說,文獻科學奠基於專門的主題知識,但圖書館科學在學校裡的教育往往是著重在圖書館的業務方面,這影響了這個領域的重心及基礎,而館員由於受的是業務方面的訓練,缺乏處理複雜資訊的學科知識,所以失去了在資訊管理中的支配地位。

在資訊科學領域中,資訊檢索資訊檢索可算是最重要的一個名詞,但為什麼要用information這個詞?傳統上IR關心的是資訊的storage and retrieval,這樣的傳統其實較接近於document/text retrieval。Van Rijsbergen認為information retrieval中的information並不是一般科技性的意義,此處的information是不能測量的,但在資訊科學的領域常常忽略了資訊的意義,因此很多時候我們可以用document來代替information這個字。而Lancaster指出IR系統最多只能告知使用者所需的資料是否存在,以及這些文件可以在什麼地方取得,卻不能告知使用者與其問題相關的主題。 Brookes則認為檢索效能的計算是測量文獻的相關程度以及其被使用的數量,這是一種物質性的測量,與information的概念並不符合,應該改為 document retrieval,他推測資訊科學家不喜歡和圖書館科學連結在一起的一個原因是許多重要科技的發展並不是由圖書館人員完成的,而是由和電腦科學密切連結的人所完成。

通常資訊科學的文獻使用以下的敘述來區別document retrieval及fact retrieval:文件檢索系統提供一個關於查詢主題的參考書目列表,事實檢索系統則提供了一個具體的答案。有些著名的資訊科學研究者認為資訊科學最終的目的是發展出事實檢索的系統,例如Karen Sparck Jones指出使用者關心的是所需的資訊如何取得,他需要的是文件中的資訊,但檢索系統往往只提供了文件而已;Paul Otlet's則認為應該關心的是事實。但事實上要讓書目資訊系統變成事實檢索系統是很難達到的。

各圖書館學、文獻學、資訊學家對於各種的文件都感興趣,他們核心的興趣與專業是關於文獻的傳播與出版,假如把information一詞用在天文學家的活動上,資訊科學家就不是能夠解釋星體資訊的專家,而是管理由天文學家提供之各種資訊的專家,在此時的information被定義為一個較一般資訊科學所提供還要更廣泛的意義,但出版者、研究者、歷史學家、律師、和老師也可說是某種形式上的專業資訊管理者,因此Belkin指出,一般來說資訊科學中任何資訊的概念必須至少指向資訊科學中某一個特定的範圍。但在資訊科學的領域中,有時我們感興趣於研究者如何選擇取得資訊的管道,包括他們喜歡透過圖書館或透過自己的觀察取得資訊。

以下是一個資訊科學最常使用的定義:資訊科學關心的是資訊的產生、收集、組織、解釋、儲存、檢索、轉換以及使用,特別強調任何現代科技的應用。但沒有一種科學應該由它使用的工具所定義,而應藉由它所研究的對象來定義。資訊專家往往對於資訊的來源、資訊生產的社會脈絡、文獻類型等等擁有較廣的概述,同時也應該對於科學的哲學、使用於特殊目的之語言的原則擁有較廣的知識。資訊科學家的工作是一個由上到下的模式,從一般的知識領域和資訊來源到特殊的;而領域專家則是一個由下到上的模式,由特殊到一般。作者則認為只要是可以解決重要問題的答案就是資訊,所以任何事物都可以成為資訊。

若從資訊理論的觀點來看,資訊是可以被明確定義及測量的,例如Lawrence & Giles (1999) 發現大約有15 terabytes的資訊存在網路上。這樣的概念與資訊專家在檢索、選擇、索引資料時使用的不同,這些活動和資訊的內容與意義有關,而不是只注重他們的儲存與傳播,資訊科學家關心的是資訊內含的意義,而不是資訊本身。

Karl Popper曾提出「三個世界」的理論,他認為知識宇宙有三個不同的世界,第一個世界是物體(Physical objects)世界,或物理現象的知識世界;第二世界為意識形態,或精神狀況,或行為表現的知識世界;第三世界為客觀的思想內容,特別指科學的因果思想,以及技術作品的知識世界。物質與精神意識相互作用,相互影響,第三世界則自成一格,是一個完全獨立自主的世界。Popper認為每一本書都存著客觀的知識,即使它從未被人讀過,仍舊是一本書,所以他將一本書,包括書中的內容,劃歸為第三世界,主要是在強調圖書的獨立特性(引自何光國,民90)。而 Buckland在1991年提出的Information-as-thing,除了再度採用文件的概念之外,也同時點出了information主觀的性質,他認為任何事物都可能成為資訊。

在文章的最後,作者認為我們應該更努力試著界定出資訊科學的本質與特定的目標,並且加強這個領域的歷史持續性,將資訊的概念與其他學科作連結,而不是認為這是一個孤立的學科。當我們在問資訊的概念是什麼的同時,最重要的是能確定一個的問題:當採用不同的資訊概念或理論時,將會產生什麼不同的結果?

Metadata