大數(shù)據(jù)導(dǎo)航的自動(dòng)駕駛汽車能夠?qū)崿F(xiàn)360度全方位感知,安裝在駕駛室內(nèi)的攝像頭會識別交通指示牌和信號燈,輪胎附近的傳感器可以根據(jù)速度和方位推算汽車當(dāng)前所在的位置,而連接GPS和谷歌地圖的路線系統(tǒng)可以讓它找到通往目的地的最快捷路線。
紐約警方通過分析案件與發(fā)薪日、體育賽事、天氣變化、假日等變量的相關(guān)性,預(yù)測最可能發(fā)生罪案的“熱點(diǎn)”地區(qū),并預(yù)先在這些地區(qū)部署警力。無論是從時(shí)間縱向上來看,還是部門間數(shù)據(jù)聯(lián)動(dòng)的橫向上來看,這種數(shù)據(jù)搜集視野都呈現(xiàn)出全景式的特點(diǎn),從而更加富有生命力。
擁抱數(shù)據(jù)的雜亂
執(zhí)著于精確性是信息缺乏時(shí)代的產(chǎn)物。傳統(tǒng)的數(shù)據(jù)分析師很難容忍數(shù)據(jù)中存在的錯(cuò)誤和噪聲,他們會花大量的精力讓數(shù)據(jù)更加精確和標(biāo)準(zhǔn),提升基礎(chǔ)數(shù)據(jù)的精準(zhǔn)度以降低分析結(jié)果的錯(cuò)誤概率。
當(dāng)我們測量事物的能力受限時(shí),關(guān)注最重要的事情和獲取最精確的結(jié)果是可取的。如果購買者不知道牛群里有 80頭牛還是 100頭牛,那么交易就無法進(jìn)行。因?yàn)樾枰治龅臄?shù)據(jù)很少,所以我們必須盡可能精準(zhǔn)地量化我們的記錄。在大數(shù)據(jù)時(shí)代,很多時(shí)候,追求精確度已經(jīng)變得不可行,甚至不受歡迎了。例如,一個(gè)小商店在晚上打烊時(shí)要把收銀臺里的每分錢都數(shù)清楚,但是我們不會,也不可能用“分”這個(gè)單位精確計(jì)算國民生產(chǎn)總值。
曾經(jīng)我們大部分的習(xí)慣都建立在一個(gè)預(yù)設(shè)立場上,即用來進(jìn)行決策的信息必須是少量、精確且至關(guān)重要的。然而,當(dāng)數(shù)據(jù)量變大、數(shù)據(jù)處理速度加快且數(shù)據(jù)變得不那么精確時(shí),這些預(yù)設(shè)立場都不復(fù)存在了。隨著互聯(lián)網(wǎng)的發(fā)展,特別是社交媒體、電子商務(wù)以及智慧終端的快速發(fā)展,數(shù)量巨大的數(shù)據(jù)碎片時(shí)刻都在產(chǎn)生。這些數(shù)據(jù)來自不同的渠道、不同的領(lǐng)域,有著不同的格式與標(biāo)準(zhǔn)。數(shù)據(jù)的雜亂變得不可避免,如果只是執(zhí)迷于數(shù)據(jù)的精確性,你可能會感到無所適從。
在大數(shù)據(jù)時(shí)代,我們完全可以用一種更輕松的心態(tài)看待雜亂性,并接受它帶來的精確性問題。試想,如果雜質(zhì)是偶然的,它一定會被更多的正確數(shù)據(jù)淹沒;如果噪聲存在規(guī)律,足夠多的數(shù)據(jù)可以發(fā)現(xiàn)這個(gè)規(guī)律,從而過濾噪聲;如果誤差是內(nèi)在的必然性,更多樣化的數(shù)據(jù)采集和信息融合也必然能糾正誤差。例如,GPS在監(jiān)測地理位置時(shí)可能有幾十米的誤差,但加上了地圖數(shù)據(jù)可以保證導(dǎo)航準(zhǔn)確性?;趩蝹€(gè)攝像頭的車牌抓取和識別可能受光照條件、空氣能見度、車輛運(yùn)行速度和遮擋情況的影響,但獲得的部分信息(不完整車牌和車輛特征),可以與其他攝像頭獲取的信息進(jìn)行對照和相互印證。現(xiàn)代技術(shù)讓我們能夠?qū)嬰s的數(shù)據(jù)進(jìn)行快速高效的整理,幫助我們做出更好的決策。