正文

05 統(tǒng)計(jì)學(xué)家的大數(shù)據(jù)“狂想曲”(1)

看穿一切數(shù)字的統(tǒng)計(jì)學(xué) 作者:(日)西內(nèi)啟


正如前一章所說(shuō)的那樣,“大數(shù)據(jù)”這個(gè)詞從誕生到流行經(jīng)歷了很長(zhǎng)一段時(shí)間。

而現(xiàn)在的企業(yè)幾乎每周都會(huì)發(fā)布關(guān)于“大數(shù)據(jù)”的報(bào)告,雜志和網(wǎng)絡(luò)媒體上也時(shí)常出現(xiàn)“大數(shù)據(jù)今后的發(fā)展”或者“如何在大數(shù)據(jù)時(shí)代生存”等相關(guān)文章。如今,只要是稍微關(guān)心計(jì)算機(jī)信息的人,對(duì)于“大數(shù)據(jù)”這個(gè)詞一定不會(huì)感到陌生。

在硬件供應(yīng)商、系統(tǒng)集成商、獨(dú)立咨詢公司等,有很多期待“大數(shù)據(jù)”概念可以帶來(lái)商業(yè)機(jī)會(huì)的人。順便說(shuō)一下,那些對(duì)計(jì)算機(jī)和統(tǒng)計(jì)學(xué)都不太了解的商業(yè)評(píng)論家們,也紛紛斷言“今后是大數(shù)據(jù)的時(shí)代”。

就連那些一提起與阻止列表和收支記錄等工作相關(guān)的數(shù)據(jù)記錄就只能想到Excel表格的人,也對(duì)新數(shù)據(jù)庫(kù)的技術(shù)很感興趣,對(duì)100多年以前發(fā)明的統(tǒng)計(jì)方法一竅不通的人也對(duì)“數(shù)據(jù)挖掘”充滿期待。由此可見(jiàn),現(xiàn)在對(duì)統(tǒng)計(jì)學(xué)家來(lái)說(shuō)是最適合大展拳腳的時(shí)代。

演奏大數(shù)據(jù)“狂想曲”的專業(yè)術(shù)語(yǔ)

但是,對(duì)于“大數(shù)據(jù)”,或者說(shuō)對(duì)于“大數(shù)據(jù)”的分析會(huì)產(chǎn)生什么樣的價(jià)值,會(huì)給投資成本的核算帶來(lái)多少好處,這些內(nèi)容究竟又有多少人能夠理解呢?

是沒(méi)有人能夠理解,還是理解的人因?yàn)榕c自己的商業(yè)利益沒(méi)有太大的關(guān)聯(lián),所以沒(méi)有進(jìn)一步的宣揚(yáng)和提倡?不管怎樣,對(duì)于這方面的問(wèn)題我們很少會(huì)見(jiàn)到與之有關(guān)的回答。

取而代之的是,我們經(jīng)常會(huì)聽(tīng)到為了更有效率地處理大規(guī)模的數(shù)據(jù),推出新產(chǎn)品、新規(guī)格、新功能等。

比如在硬件方面,甲骨文公司引以為傲的Exadata系統(tǒng)的性能比以前的數(shù)據(jù)庫(kù)系統(tǒng)強(qiáng)大10倍以上,而被稱為Hadoop的工作模式,則可以允許在復(fù)數(shù)硬件上同時(shí)對(duì)大規(guī)模數(shù)據(jù)進(jìn)行高速處理。相信很多人都聽(tīng)說(shuō)過(guò)這些信息吧。


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)