正文

小樣本的出錯風險可能高達50%

思考,快與慢 作者:(美)丹尼爾·卡尼曼


沒有接受過統(tǒng)計學方面訓練的人是出色的“直覺性統(tǒng)計學家”。我與阿莫斯在20世紀70年代早期的合作便始于對這個觀點的討論。他對我(在大學)的研究班及我本人講過,密歇根大學的一些研究人員對直覺性統(tǒng)計抱有樂觀態(tài)度。我個人對那個觀點有種強烈的感覺:那段時間我發(fā)現(xiàn)自己并不是一個出色的直覺性統(tǒng)計學家,但是我也不相信別人會比我好多少。

對于一個研究型心理學家來說,樣本變差沒有什么特別的。它是個煩人且損失又大的麻煩事,會把每項實驗都變成一場賭博。試想你希望證明6歲女孩的平均詞匯量比同齡男孩的詞匯量更豐富的假設。這個假設從整體來說是成立的,女孩的平均詞匯量確實要比男孩的豐富一些。然而,盡管男孩與女孩差別很大,但你很可能會抽取到男女相差不太明顯的樣本,甚至會抽到一個男孩比女孩詞匯測試成績還要好的樣本。如果你是那個研究者,這個結(jié)果對于你來說代價就太高了,因為它浪費了你的時間和精力,卻無法證實一個實際正確的假設。使用一個足夠大的樣本是降低這種風險的唯一方法。選擇小樣本的研究者只能看自己是不是能選對合適的樣本了。

想要對樣本錯誤的風險作出評估,只需通過一個相當簡單的步驟就可以實現(xiàn)。然而按照慣例來看,心理學家并不是通過計算來選定樣本大小的。他們聽從自己的判斷,但這些判斷往往是錯的。在與阿莫斯發(fā)生意見分歧不久之前,我讀過一篇文章,文章通過生動的觀察結(jié)果展示了研究人員所犯的錯誤(他們現(xiàn)在仍在犯這種錯誤)。該文作者指出心理學家選擇的樣本通常都很小,致使他們有50%的風險不能夠證實其正確的假設,而任何研究人員都不會在頭腦清醒的情況下接受這種風險。對此有一個貌似正確的解釋,即心理學家對于樣本大小的決定反映了他們普遍存在的一個直覺性錯誤觀念,即對于樣本變差范圍的錯誤看法。

這篇文章令我十分震驚,因為我在自己的研究中碰到了一些問題,卻在這篇文章中找到了相關(guān)解釋。與大多數(shù)研究型心理學家一樣,我也墨守成規(guī)地選擇了一些過小的樣本,因此得到的實驗結(jié)果毫無意義?,F(xiàn)在,我知道了原因:那些奇怪的結(jié)果實際上就是我這種研究方法的典型產(chǎn)物。我的錯誤特別令人尷尬,因為我教過統(tǒng)計學,也知道該怎樣計算樣本的大小,以便將風險降至可以接受的程度。但是,我從未通過計算來確定樣本大小。和我的同事一樣,我被傳統(tǒng)所禁錮,相信自己設計實驗的直覺,也從未認真考慮過樣本選擇會帶來的那些風險。阿莫斯來參加研討會時,我已經(jīng)意識到自己的直覺是錯誤的。在研討會中,我們很快達成共識—密歇根的那些樂觀派是錯誤的。

我與阿莫斯開始調(diào)查一個問題:只有我自己這么愚蠢還是我只是眾多愚蠢的人之一,我們通過一項測試來證實這個問題,測試對象為一些數(shù)學家,想看看這些人是否也會犯類似的錯誤。我們設計了一份調(diào)查問卷,其中描述了真實的研究情境,包括一些成功實驗的復制。問卷要求研究人員選擇樣品大小,對其決定可能帶來的失敗風險進行評估,并為那些正在設計自己實驗的研究生提供建議。在 “數(shù)學心理學協(xié)會”的一次會議上,阿莫斯收集了一組資深受試者(包括兩本經(jīng)濟學著作的作者)的反應。結(jié)果很明顯:我并不是唯一一個愚蠢的人。大多數(shù)受試者都會犯和我一樣的錯誤。顯然,即使是專家,在選擇樣品大小時也無法充分集中注意力。

我和阿莫斯將我們合寫的第一篇文章命名為“對小數(shù)定律的盲信”。我們半開玩笑地解釋道,“對于隨意取樣的直覺似乎符合小數(shù)定律,由此可以斷言大數(shù)法則對于小數(shù)定律同樣適用”。在文章中,我們還收錄了一個措辭有力的建議,即研究人員認為他們“對于統(tǒng)計直覺應抱有一些懷疑,只要條件允許,都應采用計算方法來確定樣本規(guī)模,而不是依靠直覺印象作決定”。


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號