這樣大的數(shù)據(jù)量意味著什么?如果把這些數(shù)據(jù)全部記在書中,這些書可以覆蓋整個(gè)美國52次。如果將之存儲(chǔ)在只讀光盤上,這些光盤可以堆成五堆,每一堆都可以伸到月球。公元前3世紀(jì),埃及的托勒密二世竭力收集了當(dāng)時(shí)所有的書寫作品,所以偉大的亞歷山大圖書館可以代表世界上所有的知識(shí)量。但當(dāng)數(shù)字?jǐn)?shù)據(jù)洪流席卷世界之后,每個(gè)地球人都可以獲得大量數(shù)據(jù)信息,相當(dāng)于當(dāng)時(shí)亞歷山大圖書館存儲(chǔ)的數(shù)據(jù)總量的320倍之多。
事情真的在快速發(fā)展。人類存儲(chǔ)信息量的增長速度比世界經(jīng)濟(jì)的增長速度快4倍,而計(jì)算機(jī)數(shù)據(jù)處理能力的增長速度則比世界經(jīng)濟(jì)的增長速度快9倍。難怪人們會(huì)抱怨信息過量,因?yàn)槊總€(gè)人都受到了這種極速發(fā)展的沖擊。把眼光放遠(yuǎn)一點(diǎn),我們可以把時(shí)下的信息洪流與1439年前后古登堡發(fā)明印刷機(jī)時(shí)造成的信息爆炸相對比。歷史學(xué)家伊麗莎白·愛森斯坦(Elizabeth Eisenstein)發(fā)現(xiàn),1453—1503年,這50年之間大約有800萬本書籍被印刷,比1 200年之前君士坦丁堡建立以來整個(gè)歐洲所有的手抄書還要多。換言之,歐洲的信息存儲(chǔ)量花了50年才增長了一倍(當(dāng)時(shí)的歐洲還占據(jù)了世界上大部分的信息存儲(chǔ)份額),而如今大約每三年就能增長一倍。
這種增長意味著什么呢?彼特·諾維格(Peter Norvig)是谷歌的人工智能專家,也曾任職于美國宇航局噴氣推進(jìn)實(shí)驗(yàn)室,他喜歡把這種增長與圖畫進(jìn)行類比。首先,他要我們想想來自法國拉斯科洞穴壁畫上的標(biāo)志性的馬。這些畫可以追溯到一萬七千年之前的舊石器時(shí)代。然后,再想想一張馬的照片,想想畢加索的畫也可以,看起來和那些洞穴壁畫沒有多大的差別。事實(shí)上,畢加索看到那些洞穴壁畫的時(shí)候就曾開玩笑說:“自那以后,我們就再也沒有創(chuàng)造出什么東西了。”
他的話既正確又不完全正確。你回想一下壁畫上的那匹馬。當(dāng)時(shí)要畫一幅馬的畫需要花費(fèi)很久的時(shí)間,而現(xiàn)在不需要那么久了。這就是一種改變,雖然改變的可能不是最核心的部分——畢竟這仍然是一幅馬的圖像。但是諾維格說,想象一下,現(xiàn)在我們能每秒鐘播放 24幅不同形態(tài)的馬的圖片,這就是一種由量變導(dǎo)致的質(zhì)變:一部電影與一幅靜態(tài)的畫有本質(zhì)上的區(qū)別!大數(shù)據(jù)也一樣,量變導(dǎo)致質(zhì)變。物理學(xué)和生物學(xué)都告訴我們,當(dāng)我們改變規(guī)模時(shí),事物的狀態(tài)有時(shí)也會(huì)發(fā)生改變。
我們就以納米技術(shù)來為例。納米技術(shù)就是讓一切變小而不是變大。其原理就是當(dāng)事物到達(dá)分子的級別時(shí),它的物理性質(zhì)就會(huì)發(fā)生改變。一旦你知道這些新的性質(zhì),你就可以用同樣的原料來做以前無法做的事情。銅本來是用來導(dǎo)電的物質(zhì),但它一旦到達(dá)納米級別就不能在磁場中導(dǎo)電了。銀離子具有抗菌性,但當(dāng)它以分子形式存在的時(shí)候,這種性質(zhì)會(huì)消失。一旦到達(dá)納米級別,金屬可以變得柔軟,陶土可以具有彈性。同樣,當(dāng)我們增加所利用的數(shù)據(jù)量時(shí),我們就可以做很多在小數(shù)據(jù)量的基礎(chǔ)上無法完成的事情。