這個(gè)現(xiàn)象只有兩種解釋:要么是該婚戀網(wǎng)站的會(huì)員身高非常高,高于美國(guó)男女身高的平均水平;要么是這些會(huì)員在填寫自我介紹資料的時(shí)候,虛報(bào)了自己的身高。
有一種理想化的銅鐘形曲線,數(shù)學(xué)家們給它起名叫“正態(tài)分布”,它是統(tǒng)計(jì)學(xué)中最重要的概念之一。正態(tài)分布的美來自它理論上的性質(zhì)。數(shù)學(xué)可以證明,只要大量相互獨(dú)立、大小類似的輕度隨機(jī)(即方差不能為無窮大)事件相疊加,其結(jié)果必然呈正態(tài)分布。在自然界和人類的生活中,大量獨(dú)立隨機(jī)事件相疊加的情況比比皆是,所以正態(tài)分布很常見。
需要強(qiáng)調(diào)的是,并不是所有事情都符合上面這幾個(gè)條件,因此,并不是所有的事情都服從正態(tài)分布。這是我本章想要強(qiáng)調(diào)的第二個(gè)要點(diǎn)。人們?cè)?jīng)認(rèn)為大部分事物都應(yīng)該服從正態(tài)分布,但事實(shí)并非如此。近100年來,尤其是最近幾十年以來,科學(xué)家和統(tǒng)計(jì)學(xué)家們發(fā)現(xiàn),很多現(xiàn)象并不服從正態(tài)分布,而是另一種分布。奇怪的是,幾乎所有的初級(jí)統(tǒng)計(jì)學(xué)教材都對(duì)這種分布避而不談,而是把幾乎所有的篇幅都放到了正態(tài)分布上。即使偶爾有幾本統(tǒng)計(jì)學(xué)書籍談到了這種分布,也會(huì)把它列為一種“病理標(biāo)本”,而不肯承認(rèn)它是自然界和人類社會(huì)中常見的現(xiàn)象。我認(rèn)為這太不可理喻了。下面,我要為這種分布正名,了解了這種分布后你就會(huì)發(fā)現(xiàn),現(xiàn)代生活中的很多事情都可以被這種分布解釋得很清楚。正態(tài)分布又被稱為常態(tài)分布,但我認(rèn)為我下面講到的這種分布才應(yīng)該稱為新的常態(tài)分布。
我們來考慮一下美國(guó)各個(gè)城市的城市規(guī)模的分布。城市規(guī)模并不是圍繞一個(gè)比較中庸的值向兩側(cè)均勻展開的,城市規(guī)模的分布也不呈銅鐘形。在美國(guó),絕大部分的城市都非常小,所以它們都擠在下圖的左側(cè)區(qū)域。