數(shù)據(jù)分析的過程,實(shí)際上就是一個(gè)不斷探索的過程。需要分析的數(shù)據(jù)越復(fù)雜就越是如此,隨著分析的不斷深入,發(fā)現(xiàn)的問題就會(huì)越多,甚至?xí)霈F(xiàn)與實(shí)際情況完全相反的結(jié)果,為此就要嘗試不同的分析方法,而在分析中使用的數(shù)據(jù)如果發(fā)現(xiàn)有什么問題也要及時(shí)地進(jìn)行修正,上述這些問題即便是經(jīng)驗(yàn)非常豐富的統(tǒng)計(jì)學(xué)家也無法避免。實(shí)際上為了避免出現(xiàn)錯(cuò)誤,越是經(jīng)驗(yàn)豐富的統(tǒng)計(jì)學(xué)家,在分析的準(zhǔn)備上所花費(fèi)的時(shí)間就越多。
在對參考結(jié)果選擇各種各樣的方法與數(shù)據(jù)作為突破口的探索分析之中,嘗試的次數(shù)是非常重要的。因此,那些必須使用特殊工具或者奇妙程序的情況,以及必須長時(shí)間等待分析結(jié)果的情況都應(yīng)該盡可能地避免。這樣的話,就算最后必須以全部數(shù)據(jù)為對象進(jìn)行分析和驗(yàn)證,也可以事先獲取一定量的抽樣數(shù)據(jù),并且通過探索分析找到建立假設(shè)的依據(jù)。
雖然為了建立假設(shè)尋找一定量抽樣數(shù)據(jù)的方法,需要相當(dāng)專業(yè)的統(tǒng)計(jì)學(xué)知識,但如果只是為了掌握數(shù)據(jù)概況的話,有上萬條數(shù)據(jù)就夠了,這種程度的統(tǒng)計(jì)工作僅靠一個(gè)熟練應(yīng)用Excel的人就可以搞定。
當(dāng)然,對龐大的數(shù)據(jù)進(jìn)行高速且符合一定條件的隨機(jī)抽樣調(diào)查,以及對最終的分析結(jié)果是否準(zhǔn)確進(jìn)行驗(yàn)證的時(shí)候,還是需要大數(shù)據(jù)技術(shù)發(fā)揮實(shí)力。但是,這種速度和準(zhǔn)確度究竟有多大的價(jià)值呢?這個(gè)問題的答案,就要取決于分析結(jié)果能夠產(chǎn)生多大的價(jià)值了。
實(shí)際上分析本身并沒有價(jià)值,如何活用分析的結(jié)果,最終得到的價(jià)值也是不同的。