高德納的一份報告認(rèn)為:大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。這一概念雖然簡潔,卻內(nèi)涵豐富:第一,它認(rèn)為大數(shù)據(jù)是一種信息資產(chǎn);第二,這種信息資產(chǎn)具有海量、高增長率和多樣化的屬性;第三,它指出了大數(shù)據(jù)的應(yīng)用價值和革新意義,即具有更強(qiáng)的決策力、洞察力和流程優(yōu)化能力。
筆者更贊同高德納的定義,把大數(shù)據(jù)看作一種戰(zhàn)略和習(xí)慣,一種新的世界觀和方法論。例如,谷歌不用分發(fā)口腔試紙和聯(lián)系醫(yī)院,就能給出和基于大量真實(shí)病例所得到的流感情況一致的結(jié)果,并且比疾控中心提前了兩周,就是因?yàn)樗治隽藬?shù)千億的數(shù)據(jù),建立了強(qiáng)大的預(yù)測模型。從2009年10月起,“谷歌流感趨勢”網(wǎng)站開始提供全球每周流感疫情預(yù)測,對于數(shù)據(jù)較完備國家的預(yù)測能精確到省份,并能顯示橫跨7年的歷史數(shù)據(jù)。
另一個有代表性的例子發(fā)生在能源計量領(lǐng)域。美國軟件公司Opower與多家電力公司合作,在幾百萬戶家庭安裝了智能電表,這些電表每隔15分鐘就讀一次用電數(shù)據(jù)。Opower公司據(jù)此每個月向每戶家庭提供一份個性化報告,把該家庭的電費(fèi)與周圍鄰居進(jìn)行對比,顯示該家庭的用電情況在全美類似家庭中所處的水平,以鼓勵節(jié)約用電,預(yù)計每年為美國消費(fèi)用電節(jié)省5億美元。由此可見,大數(shù)據(jù)成為政府節(jié)能減排的千里眼、萬只手,并且做到了深入每戶家庭、量身定制解決方案,這在入戶抄電表的傳統(tǒng)工作方式下根本是無法想象的事情。
打開數(shù)據(jù)利用的想象空間
分析師馬特·艾斯萊特將大數(shù)據(jù)定位為“之前因?yàn)榧夹g(shù)限制而被忽略的數(shù)據(jù)”。的確,盡管從數(shù)據(jù)中發(fā)現(xiàn)價值的實(shí)踐由來已久,但是在大數(shù)據(jù)時代,數(shù)據(jù)的價值才真正被發(fā)掘出來,人們用數(shù)據(jù)說話、用數(shù)據(jù)決策、用數(shù)據(jù)管理、用數(shù)據(jù)創(chuàng)新的意識才真正被喚醒。
至頂網(wǎng)副總編趙效民提出了一個非常有意思的觀點(diǎn)。他認(rèn)為:“大數(shù)據(jù)的出現(xiàn)標(biāo)志著人類在數(shù)據(jù)利用方面進(jìn)入了一個新的階段,它代表了一種理念(數(shù)據(jù)能源)、一種思路(從數(shù)據(jù)搜集到數(shù)據(jù)分析再到數(shù)據(jù)呈現(xiàn)的整體構(gòu)想)和一種新工具(將結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)和語義與機(jī)器化數(shù)據(jù)匯聚、統(tǒng)一處理、分析與呈現(xiàn)的工具)的集合。它賦予了人類認(rèn)知數(shù)據(jù)的新能力,也進(jìn)一步打開了人類在數(shù)據(jù)利用方面的想象空間?!?/p>
趙效民進(jìn)一步闡述,放眼地球上的各種能源,就會發(fā)現(xiàn)大數(shù)據(jù)與其有太多相似之處。物質(zhì)成為能源的前提在于人類對它們的認(rèn)知。在遠(yuǎn)古時期,人類因雷電引火,發(fā)現(xiàn)了火和木材這兩種能源。隨著人類文明的進(jìn)步,人類逐漸發(fā)現(xiàn)了越來越多的能源,比如煤、天然氣、石油和太陽能。它們已經(jīng)在地球上靜靜地存在了成萬上億年,只是在人類掌握了相應(yīng)的科技與工具之后,它們才得到利用。數(shù)據(jù)也是如此,如果數(shù)據(jù)存在一個生成/采集—應(yīng)用/加工—保存/管理—分析/挖掘—再保存或刪除這樣的一個周期,那么從其生成的那一刻起,它就存在應(yīng)有的價值,只是在于你是否有能力發(fā)現(xiàn)它們。這需要新的理念、知識、技術(shù)與相應(yīng)的工具。原始人即使知道地下有石油,也無法開采,對所謂的數(shù)據(jù)分析,道理也是一樣的。