正文 第3章 操作主義和本質主義——「但是,博士,這到底是什麼意思?」

物理學家真正理解地心引力是什麼嗎?我的意思是真正。他們知道「地心引力」這個術語的真正含義是什麼?它的內在本質是什麼?說到地心引力時最終所要表達的意思是什麼?說到底,它究竟是什麼?

類似這樣的問題反映了一種科學觀點,哲學家波普爾稱其為「本質主義」。這種觀點認為:從內在本質或者本質屬性的角度對現象做出最終解釋,才算得上是好的科學理論。支持這種觀點的人通常也相信,無法對現象做出最終解釋的任何理論都是無用的,這樣的理論不能反映真實的內在情況,不能反映世界存在方式的本質。本章,我們將討論為什麼科學不去回答本質主義者的問題,而是通過對概念進行操作性定義得以進步。

事實上,科學家並不企圖獲得本質主義者所追求的那類知識。從這一意義上講,對於本章一開始提出的問題的正確回答是:科學家不知道地心引力是什麼。科學並不試圖回答關於宇宙的「終極」問題,彼得·米德瓦(Peter Medawar, 1984)曾寫道:

(確實存在)那些科學不能回答並且在科學發展的可預見的範圍之內也不可能得到答案的問題。比如那些孩子們會提出的問題——「終極問題」……我能想到的這樣的問題有:世界是如何開始的?我們來到這世間是為了什麼?生活的意義是什麼?(p.66)

(然而,)即使科學不能回答終極問題,但也不意味著必須接受其他的答案;也不能理所當然地認為,既然這類終極問題能被提出,就一定能夠被回答。就我們目前的理解力而言,這類問題是無從回答的。(p.60)

(但是,最終)就它能回答的那類問題而言,科學的潛力是無窮的……沒有什麼可以阻擋或中止科學的發展,除了諸如缺乏勇氣之類的道德方面的缺陷。(p.86)

科學家之所以質疑那些自稱為終極問題給出絕對答案的人、理論或者觀念體系,一個原因就是科學家認為終極問題是無法回答的。科學家並不會宣稱他們可以提供完美的知識;科學的獨特優勢並不在於它是一個不會犯錯的過程,而在於它提供了一種消除錯誤的方式,它能不斷消除我們認識中的錯誤。再者說,自稱完美或絕對知識的主張及做法,卻往往會阻礙人們的探索。自由而開放地探索知識是科學活動的一個先決條件。科學家們總是在懷疑那些號稱已經找到問題最終答案的言論。

本質主義者的態度通常有一種表現:在探求知識之前,過於關注術語或概念的定義。「但是我們必須首先界定我們的術語」是本質主義者常用的一個口號。「某理論性概念的真正含義是什麼?」這種理念似乎意味著,當一個詞被當做理論中的概念使用之前,我們必須對這個詞的使用所涉及的所有潛在語言問題有一個全面而且清晰的理解。事實上,這正好與科學家的工作方式相反。在對物理世界開展研究之前,物理學家不會花費氣力討論如何使用「能量」一詞,或者當我們討論物質的基本組成時,「粒子」一詞是否真正表達了我們要表達的本質含義。

在科學領域裡,確定某概念的意義,是在與該術語有關的現象得到一定程度的研究之後,而非研究之前。一個精確的概念性術語來自科學過程中固有的那種數據和理論間的相互作用,而不是關於語言用法的辯論。本質主義者讓我們陷入無休止的文字爭論,而許多科學家堅信這樣的文字遊戲使我們脫離了事物的實質。例如,對於「生命一詞的真正含義是什麼」這個問題,兩個生物學家的回答是「沒有什麼真正的含義,它只是足夠好地滿足我們生物學家工作需要的一種用法,並不是爭論或辯駁的主題」(Medawar & Medawar, 1983, pp.66-67)。總之,科學家的目的是解釋現象,而非對措詞進行分析。在所有的科學學科里,進步的關鍵在於放棄本質主義,接受操作主義。這正是本章中我們探討的主題。沒有別的學科比心理學更能說明這個問題了。

那麼,如果不是來自於語言文字的爭論,科學中概念的含義又來自於哪裡呢?正確使用某一科學概念的標準是什麼?為了回答這些問題,我們必須討論操作主義。它對於在科學領域中建構理論至關重要,尤其對於評估心理學中的理論及觀念具有重要作用。

儘管操作主義形式多樣,但是對於科學信息的使用者來說,用最廣泛的思路去思考操作主義是最有效的。「操作主義」只是這樣一種思想:科學理論里的概念必須立足於可觀測事件,或與可觀測事件相關聯,而這些可觀測事件是可以被測量的。將概念與可觀測事件相聯繫的是概念的操作性定義,這使概念公開化了。操作性定義使得概念從個人化的感覺和直覺中分離出來,並且允許任何實施可測量操作的人對概念進行檢驗。

例如,把「飢餓」這個概念定義為「我胃裡不好受的感覺」,並不是一個操作性定義,因為它與個人對於「不好受的感覺」的體驗相聯繫,因此不能被其他觀察者知悉。相反,涉及一些可測量的食物剝奪時間或者像血糖水平這樣的生理指標的定義才是操作性的,因為它包含了任何人都可以實施的可觀測的測量。同樣,心理學家不同意將「焦慮」定義為「我不時會感到的不舒服和緊張」,而是必須用像問卷和生理指標測量這樣的操作來定義概念。上述那個定義是個人對身體狀況的解釋,他人無法複製;而後者則是把概念放在公共科學領域進行解釋。

在科學領域裡,定義一個概念靠的是一系列操作,而非單獨的行為事件或任務,意識到這點非常重要。相反,一些差別細微的任務和行為事件通常聚合在一個概念上(在第8章我們將會更多地討論聚合性操作)。例如,教育心理學家根據利用諸如「伍德庫克閱讀能力量表」之類(Woodcock,1998)的標準化工具測得的成績來定義「閱讀能力」這個概念。該量表測出的閱讀能力總分包含了一些不同分量表測得的能力指標。這些分量表測查的能力稍有不同,但全都與閱讀相關。例如,閱讀一篇文章、想出一個合適的單詞在文章中填空、寫出一個詞的同義詞、獨立拼讀一個較難的詞,等等。所有這些任務上的表現綜合地定義了「閱讀能力」這個概念。

操作性定義促使我們認真地、經驗性地思考我們如何定義一個概念,所謂經驗性,是指要根據我們對真實世界的觀察。試想我們要給一個看起來相當簡單的概念「打字能力」下一個操作性定義。想像一下你這麼做是為了比較兩種打字教學方法的優劣。思考一下你所要做的所有決定。當然,你想要測量「打字速度」。但是要打多長的一段文章呢?僅有100個單詞的文章可能太短,而10000個單詞的文章又似乎太長。那麼到底多長才算好呢?打字速度維持多久才最符合我們對打字能力這一概念的理論建構?用什麼類型的文章來測試呢?文章是否要包含數字、公式和不常見的間距?我們如何處理錯誤?當我們測量打字能力的時候,時間和錯誤似乎都應被考慮在內,但是,如果把這兩個指標同時考慮進去的話,要如何來計算一個總分呢?我們想要讓時間和錯誤具有相同的權重,還是一個比另一個更重要?尋求一個好的操作性定義會迫使你認真考慮所有這一切;它會讓你對如何將「打字能力」進行概念化做一番透徹的思考。

概念的操作性定義要想有用,必須同時具備信度和效度。信度是指測量工具的一致性。如果你對同一概念進行多次測評,是否能夠得到相同的測量結果。信度的科學概念很容易理解,因為它與常識中的定義以及字典里的定義非常相似:「任何總能夠產生相同結果的系統所具備的一種屬性」。

試想一下,一個外行人士會如何評價一件事是否可信呢?想像一個每天早上要趕公共汽車從新澤西去曼哈頓上班的人。按照時間表,公共汽車每天應該在上午7:20到達此人等車的站點。在一個星期中,如果公共汽車到達的時間分別是7:20、7:21、7:20、7:19和7:20,那麼我們就可以說在那一周汽車的到達時間是可信的,如果下周汽車到達的時間分別是7:35、7:10、7:45、7:55和7:05,那麼我們就可以說在那一周汽車的到達時間是非常不可信的。

在科學領域中,一個操作性定義的信度以類似的方式來評估。如果我們多次測量同一概念得到的結果是近似的,那麼我們就說測量工具表現出較高的信度。如果在同一星期的周一、周三和周五,用同一IQ測驗的不同版本測量同一個人的智力,得到的分數分別是110、109、110, 那麼我們可以說這一IQ測試是非常有信度的。相反,如果三個測試分數分別是89、130和105,那麼我們就可以說這一IQ測試沒有顯示出高的信度。有一些專門的統計方法可以評估不同類型的測量工具的信度,所有標準的方法論入門教材中都有介紹。

但是請記住,信度僅僅是指前後一致,而不包括其他內容。對於一個操作性定義而言,僅有信度是不夠的,信度是一個必要而非充

上一章目錄+書簽下一頁