正文 第5章 相關和因果——用「烤箱法」避孕

幾年前,在中國台灣地區曾開展過一次大規模的研究,目的是調查哪些因素和人們對避孕工具的使用有關。一個由社會學家和內科醫生組成的大型研究團隊收集了有關環境和行為變數方面的大量數據。研究者比較感興趣的是,哪種變數能夠最準確地預測避孕方法。數據收集上來之後,研究者發現,有一個變數和使用避孕工具的相關最強,這就是:家庭中家用電器(烤箱、風扇等等)的數量(Li, 1975)。

這個結果恐怕不會促使你提出這樣的建議:在高中發放免費的烤箱以解決青少年的懷孕問題。但是,你為何不會有這樣的想法呢?電器和避孕工具使用之間的相關性很高,在眾多被測量的變數中,這個變數是唯一最準確的預測因子。我希望你的回答會是:問題關鍵在於這兩個變數間關係的「性質」而非「強度」。開展「免費烤箱計畫」預示著這樣一種觀念:烤箱導致人們使用避孕工具。而實際上我們會將這種建議視為一種荒唐的方案,至少在上面所舉的這個顯而易見的例子中,我們會認識到,這兩個變數可能有相關,但不是因果關係。

在這個例子中,我們可以猜想,這種關係之所以存在,是因為「避孕工具的使用」和「家庭中家用電器的數量」這兩個變數通過與這兩種變數都相關的其他變數聯繫起來。教育可能會是中介變數之一。我們知道,教育水平與避孕工具使用和社會經濟地位都有關係。現在我們所需要的就是這樣一個事實:經濟水平高的家庭會擁有更多的家用電器,我們都會有這樣的聯想。當然,其他的變數也可能會在二者的關係中起到中介作用。但是,無論「家用電器的數量」和「避孕工具使用」之間的相關有多麼強,這種關係都不能說明它們之間存在因果關係。

避孕方法的例子很容易讓我們理解這一章的主旨:有相關,並不意味著必然有因果關係。本章中我們將會討論阻止我們做出因果推論的兩大問題:第三變數問題和方向性問題。我們還將會討論選擇性偏見是如何導致第三變數問題的。

相關性證據的局限性並不都像「烤箱」例子那樣容易被識別。當因果關係對我們來說顯而易見時,當我們抱有根深蒂固的偏見時,或者當我們的解釋被理論定勢所主宰時,就會很容易地把相關當作因果的證據。

在20世紀初期,數以萬計的美國南部民眾罹患並死於一種叫做糙皮病的疾病(大約每年100000人死亡)。糙皮病被認為是由一種不明微生物引發的傳染性疾病,其主要癥狀是頭暈、嗜睡、潰瘍、嘔吐和嚴重腹瀉(Chase, 1977, p.205)。此後,許多來自全國糙皮病研究學會的醫生都認同這樣的證據:糙皮病和衛生條件有關。這並不令人吃驚。家在南卡羅來納州斯帕坦堡的人們似乎總是遠離糙皮病的困擾,因為他們有自來水管道和良好的污水處理設施。這種相關恰好驗證了這樣的觀點:由於糟糕的衛生條件,傳染性疾病是通過糙皮病患者的排泄物傳播開來的。

一位叫約瑟夫·戈德伯格(Joseph Goldberger)的醫生對這種解釋非常懷疑,在美國公共衛生部部長的指示下,戈德伯格針對糙皮病開展了許多研究。他認為糙皮病是由於營養不均衡的飲食引起的,簡而言之,是美國南部普遍的貧困造成的。許多的患者賴以生存的都是高碳水化合物、蛋白質含量極低的飲食,如很少量的肉類、蛋類、牛奶,以及大量的穀類、燕麥和玉米粥。戈德伯格認為污水處理條件和糙皮病之間的相關在任何一個方面都無法反映因果關係(和烤箱控制生育的例子一樣)。他認為根本原因在於,擁有清潔管道的家庭通常也都是經濟狀況良好的家庭,經濟上的差異也會反映在他們的飲食上,經濟狀況好的家庭在其飲食中包含更多的動物蛋白。

但是,請等一下!為什麼戈德伯格的因果推斷就一定是對的呢?畢竟,兩派人馬都是坐在那裡,根據相關數據推論什麼才是造成糙皮病的原因的。為什麼醫學會的醫生們不能說戈德伯袼的相關同樣也是誤導性的呢?為什麼戈德伯格能夠推翻別人的假設——一種微生物通過糙皮病患者的排泄物傳播,而這種傳播是因為不完善的污水處理設施造成的?戈德伯格對糙皮病的判斷還涉及一個小細節,這個細節我剛才沒說:戈德伯格吃下了糙皮病患者的排泄物。

戈德伯格有一類這樣得來的證據:研究者不僅觀察相關性,還靠真正地操縱關鍵變數來收集數據(有關控制操縱,將在下一章進一步討論)。這種方法經常要創造一些通常極少會自然出現的條件——說戈德伯格設計的特殊條件不會自然出現,無論怎樣強調都不會過分。

戈德伯格確信糙皮病是不會傳染的,也不會通過患者的體液傳播,他給自己注射了一名患者的血液,還吃進一名患者喉嚨和鼻子內的分泌物。此外,他還選擇了兩個病人:一個有皮癬癥狀,另一個有腹瀉。他從皮癬處刮掉鱗屑,然後和該病人的4毫升采液混合到一起,然後再加上相同數量的液體排泄物,最後與4小撮麵粉揉在一起做成小藥丸。戈德伯格、戈德伯格的助手以及戈德伯格的妻子自願服下這些藥丸。(Bronfenbrenner & Mahoney, 1.975, p.11)

無論是戈德伯格,還是其他的志願者,都沒有染上糙皮病。簡言之,戈德伯格創造了這個傳染疾病可能傳播的所有條件,結果平安無事。

戈德伯格對其他人提出的因果機制進行了操作,結果顯示該機制是無效的,儘管如此,對他自己提出的因果機制進行檢驗仍然非常必要。戈德伯格選擇了來自密西西比州監獄農場的兩組犯人,這些人都是沒有患糙皮病的,並且都是自願參加實驗。其中的一組人被給予高碳水化合物、低蛋白質的食物,這種類型的食物是戈德伯格懷疑引起糙皮病的原因。另一組被試被給予(營養成分)更均衡的飲食。5個月後,低蛋白質的這一組患上了糙皮病,而另一組卻沒有絲毫的患病跡象。戈德伯格的理論遭到了一些人的反對,這些人出於政治動機而否認貧困的存在。經過長期的抗爭,戈德伯格的假設終於被人們所接受,因為他的假設與實驗證據的契合程度是其他任何假設所不能比擬的。

糙皮病的歷史說明,如果依據相關研究來制定社會和經濟政策,必將使人類付出慘痛的代價。但這並不是意味著我們永遠不要使用相關研究的證據。恰恰相反,在許多場合,我們必須用到相關(見第8章),而在某些情況下,只要有相關就夠了(例如,當我們的目標是預測而不是決定原因的時候)。科學家們經常不得不使用不充分的知識來解決問題。重要的是,我們在運用相關性證據的時候要謹慎小心。像「糙皮病-污水」這樣的案例,在心理學研究的每個領域內都頻頻發生。這個例子也揭示了「第三變數問題」:事實上兩個變數之間的相關——這個例子中是糙皮病的發病率和污水處理條件——並不意味著這兩個變數之間有直接的因果關係,相關之所以產生,是因為這兩個變數都分別與第三變數相關——這裡是飲食——而這個變數沒有被測量。像這種污水處理條件和糙皮病之間的相關,我們通常稱之為「虛假相關」:相關的產生不是因為兩個變數之間存在一個可以測量的直接的因果聯繫,而是因為這兩個變數都與第三變數相關。

下面我們來看一個發生在現實生活中的例子。多年以來,有關公立學校和私立學校教學質量的爭論甚囂塵上。從這場爭論中得出的一些結論,很生動地展示了從相關證據推出因果關係的弊端。私立學校和公立學校的好壞是一個實證性問題,可以使用社會科學中的調查研究方法來辨別真偽。但是,這並不意味著只要這個問題是個科學問題、有可能獲得解決,就是一個非常簡單的問題。所有鼓吹私立學校優越性的人都潛在地意識到這一點,因為他們在維護自己的觀點時,常常引用這樣一個經驗性的事實:私立學校學生的成績要好過公立學校。儘管這個事實無可辯駁——各種研究中有大量一致的教育統計數據,但問題在於,用這些學生的成績數據就推出結論,即私立學校的教育本身導致了較高的分數,這麼做是否合適?

考試成績是許多不同變數的函數,這些變數彼此之間又是相關的。為了評估公立學校和私立學校的好壞,我們需要進行更為複雜的統計,而不僅僅是學校類型和學業成就之間的相關。例如,學業成就和家庭背景中許多不同指標都有關係,如父母的教育程度、父母的職業、社會經濟地位、家中藏書的數量以及其他一些因素。這些特徵都與是否把孩子送到私立學校有關係。因此家庭背景是一個潛在的第三變數,可能會影響到學業成就和學校類型之間的關係。簡言之,學業成就可能和學校質量沒有任何關係,而結果可能是:家境優越的孩子學習更好,更有可能進入私立學校。

幸運的是,還有許多複雜的相關統計方法,例如多元回歸、偏相關、路徑分析(統計學的發展部分要歸功於心理學家),這些複雜的統計方法能夠去除其他變數的影響、提出公因子或定義協變數之後

上一章目錄+書簽下一頁