正文

第8節(jié):內(nèi)在有偏的樣本(6)

統(tǒng)計數(shù)字會撒謊 作者:(美)達萊爾·哈夫


最基本的樣本是隨機樣本,它是指完全遵循隨機原則從總體中選出的樣本??傮w即形成樣本的母體。把索引卡片文件夾中每隔10個的名字抽出來,從許多紙張中任意抽出50張,在皮卡迪利大街譯者注:皮卡迪利大街是英國倫敦市一條繁華的街道。每遇見的第20個人作為訪問對象。(但需要注意的是,在最后一個例子中,總體并不是全世界的人,也不是全體英國人或者所有舊金山人,而只是當(dāng)時在皮卡迪利大街上的人。一個進行民意調(diào)查的訪問員宣稱,她選擇在火車站進行調(diào)查的原因是"在那里能遇到所有類型的人。"不過,不得不向她指出的是,某些人比如嬰兒母親的代表性并不足。)

隨機樣本的檢驗方法是:總體中的每個名字或每個事物是否具有相同的幾率被選進樣本?純隨機樣本是惟一有足夠把握經(jīng)受統(tǒng)計理論審查的樣本。但它也有不足之處,在很多情況下,獲得這種樣本的難度很大并且十分昂貴,以至于單純考慮成本就會排除它。分層隨機抽樣是一個更經(jīng)濟的替代品,目前在民意調(diào)查和市場研究等領(lǐng)域中得到了廣泛的應(yīng)用。

為了獲得分層抽樣下的隨機樣本,你需要將總體按照事先已知的優(yōu)勢比例劃分出不同的組。這時你就可能遇上麻煩:關(guān)于分組比例的信息可能并不正確。你對訪問員進行指導(dǎo),以確保他們調(diào)查到一定數(shù)量的黑人,按照這樣或那樣的比例調(diào)查屬于不同收入階層的人,調(diào)查一定數(shù)量的農(nóng)民,等等。同時,每一組人中40歲以下和40歲以上的人數(shù)相同。

這聽上去很不錯,但實際上會怎樣呢?在黑人還是白人的問題上,大部分時候訪問員能夠準(zhǔn)確判斷。但在收入分組時,他會出很多錯。至于農(nóng)民,你如何劃分一個在城鎮(zhèn)上班又有部分時間種地的人?即便是歲數(shù)的問題也會引起差錯,為了確保準(zhǔn)確性,訪問員會挑選那些看上去明顯小于40歲或明顯大于40歲的人進行調(diào)查。在這種情況下,由于缺少40歲左右的人而導(dǎo)致樣本有偏。你不可能獲得可靠的結(jié)果!


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號