正文

07 為了1%的準確率值得花費幾千萬嗎?(4)

看穿一切數(shù)字的統(tǒng)計學 作者:(日)西內啟


數(shù)據(jù)分析的過程,實際上就是一個不斷探索的過程。需要分析的數(shù)據(jù)越復雜就越是如此,隨著分析的不斷深入,發(fā)現(xiàn)的問題就會越多,甚至會出現(xiàn)與實際情況完全相反的結果,為此就要嘗試不同的分析方法,而在分析中使用的數(shù)據(jù)如果發(fā)現(xiàn)有什么問題也要及時地進行修正,上述這些問題即便是經(jīng)驗非常豐富的統(tǒng)計學家也無法避免。實際上為了避免出現(xiàn)錯誤,越是經(jīng)驗豐富的統(tǒng)計學家,在分析的準備上所花費的時間就越多。

在對參考結果選擇各種各樣的方法與數(shù)據(jù)作為突破口的探索分析之中,嘗試的次數(shù)是非常重要的。因此,那些必須使用特殊工具或者奇妙程序的情況,以及必須長時間等待分析結果的情況都應該盡可能地避免。這樣的話,就算最后必須以全部數(shù)據(jù)為對象進行分析和驗證,也可以事先獲取一定量的抽樣數(shù)據(jù),并且通過探索分析找到建立假設的依據(jù)。

雖然為了建立假設尋找一定量抽樣數(shù)據(jù)的方法,需要相當專業(yè)的統(tǒng)計學知識,但如果只是為了掌握數(shù)據(jù)概況的話,有上萬條數(shù)據(jù)就夠了,這種程度的統(tǒng)計工作僅靠一個熟練應用Excel的人就可以搞定。

當然,對龐大的數(shù)據(jù)進行高速且符合一定條件的隨機抽樣調查,以及對最終的分析結果是否準確進行驗證的時候,還是需要大數(shù)據(jù)技術發(fā)揮實力。但是,這種速度和準確度究竟有多大的價值呢?這個問題的答案,就要取決于分析結果能夠產(chǎn)生多大的價值了。

實際上分析本身并沒有價值,如何活用分析的結果,最終得到的價值也是不同的。


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號