假設(shè)我們已經(jīng)意識到了上述問題并達(dá)成共識:智力測驗(yàn)的智商僅僅是一種測量工具,它測量了人們處理事先準(zhǔn)備好的抽象問題的能力,對這些能力我們很難給出確切的定義,哪怕彼德和琳達(dá)所做的是公認(rèn)最好的智力測驗(yàn)--修訂的斯坦福-比內(nèi)測驗(yàn)(一種獨(dú)立進(jìn)行的并且不需要特別閱讀能力的測驗(yàn))。
智力測試只是智力水平的一個抽樣。與其他抽樣結(jié)果一樣,代表智力水平的智商值也具有統(tǒng)計誤差,這個誤差將用來衡量該數(shù)值的準(zhǔn)確度或可信度。
智力測驗(yàn)類似于估計某塊地玉米質(zhì)量時所做的工作,你在地里四處走動,隨意地到處摘取一些玉米穗,當(dāng)剝開并研究了大約100顆玉米穗時,你就能對整塊地的質(zhì)量大致有數(shù)。當(dāng)已知兩塊地的質(zhì)量不同,這些信息已經(jīng)足夠?qū)λ鼈兊馁|(zhì)量進(jìn)行比較了。但如果兩塊地的質(zhì)量接近,你就得摘取更多的玉米穗,并始終采用某種精確的質(zhì)量標(biāo)準(zhǔn)來給它們劃分等級。
我們可以定量地衡量你的樣本以多大的精度代表總體,那就是:可能誤差和標(biāo)準(zhǔn)誤差。
假設(shè)你要完成一項(xiàng)丈量任務(wù),即通過步測柵欄來了解幾塊地的大小。你要做的第一件事自然是檢查丈量體系的準(zhǔn)確性,通過多次步量后量出自認(rèn)為的100碼,你發(fā)現(xiàn)平均而言有3碼的誤差。這意味著,有一半的試驗(yàn)是你離開真實(shí)100碼的距離在3碼之內(nèi),而另一半試驗(yàn)是你與真實(shí)100碼的距離在3碼之上。
這樣一來,在測量100碼時,你的可能誤差是3碼,或者說3%。從此之后,每次被你步量測出的100碼應(yīng)該被記錄成100±3碼。
(大多數(shù)統(tǒng)計工作者更傾向于使用另一個類似的誤差度量工具:標(biāo)準(zhǔn)誤差。全部實(shí)驗(yàn)中將有2/3的試驗(yàn)落在加減1個標(biāo)準(zhǔn)誤差的范圍內(nèi),而不是剛好1/2的比例,人們還認(rèn)為標(biāo)準(zhǔn)誤差的數(shù)學(xué)處理更方便。出于分析目的的考慮,在這里我們還是堅持使用可能誤差,并將其運(yùn)用到斯坦福-比內(nèi)測試中。)
假設(shè)智力測驗(yàn)的可能誤差為3%,與我們假定的步量任務(wù)具有相同的可能誤差。這與智力測驗(yàn)的好壞無關(guān),而只是反映了測驗(yàn)與它所要測試的內(nèi)容具有怎樣的一致性。這樣彼德的智商更全面的表達(dá)是98±3,琳達(dá)的智商則是101±3。