正文

《刪除:大數(shù)據(jù)取舍之道》Google記得你的一切(1)

刪除:大數(shù)據(jù)取舍之道 作者:(英)維克托·邁爾-舍恩伯格


在德國城市愛森納赫(Eisenach)城外坐落著一家名叫 MAD的巨型迪斯科舞廳,它能容納 4 000名顧客。當顧客進入這家舞廳時,他們必須出示他們的護照或者由政府發(fā)布的身份證;這些顧客的詳細資料都被輸入到一個數(shù)據(jù)庫中,連同一起被存入的還包括他們的數(shù)字臉部照片。每名顧客都會有一張專用的支付卡,他們只能用這張卡支付在 MAD餐廳及多個酒吧中消費酒水與食品的賬單。每次交易都會被添加到顧客的永久數(shù)字記錄中。據(jù)一次電視報導(dǎo), 2007年年底之前, MAD數(shù)據(jù)庫存儲的信息包括一萬三千多名顧客與幾百萬次交易。60臺數(shù)字攝像機持續(xù)地拍攝迪斯科舞廳及周圍的每個角落;記錄與存儲的錄像所占的硬盤空間超過 8 000 G。顧客的實時信息、他們的交易行為,以及他們的消費偏好都被顯示在一個專用控制室里的大屏幕上,這個控制室中的情景仿佛出自 007電影一樣。管理人員很自豪地說,每周 7天每天 24個小時,當?shù)氐木於寄芡ㄟ^互聯(lián)網(wǎng)在線訪問 MAD舞廳硬盤里存儲的信息。

即便有,也只是少數(shù)顧客才能意識到他們的一舉一動都被記錄了,并且會被保存多年,同時第三方機構(gòu)還可以訪問這些信息——這給成千上萬名不知情的顧客造成了一種深遠的信息陰影。

再舉一個更為普遍的例子,互聯(lián)網(wǎng)搜索引擎。 Google、Yahoo!、微軟搜索、Ask.com以及對萬維網(wǎng)(World Wide Web)進行編錄的其他許多搜索引擎,通過對網(wǎng)頁的逐個搜索,使得所有人僅在搜索框中鍵入一兩個關(guān)鍵詞就能訪問這些網(wǎng)頁。我們知道,同時假設(shè)搜索引擎也知道大量的信息,而且這些信息可以通過全球互聯(lián)網(wǎng)上的網(wǎng)頁進行獲取。多年來,這種易于使用且功能強大的搜索引擎,成功地將世界各地的信息資源展現(xiàn)在幾十億用戶面前。然而,搜索引擎所記住的,要比網(wǎng)頁上所發(fā)布的信息多得多。

2007年春天, Google承認,直到那天他們一直在存儲每位用戶曾經(jīng)鍵入的每次搜索請求,同樣被存儲的還有每位用戶隨后點擊訪問的每一條搜索結(jié)果。

通過保存大量被整齊排列的搜索關(guān)鍵詞(Google每月收到的搜索請求大概有 300億次),Google能夠?qū)⑦@些數(shù)據(jù)與人口統(tǒng)計資料聯(lián)系起來。比如, Google能夠顯示出搜索請求的趨勢,甚至是幾年以后的趨勢。 Google能告訴我們, 2006年秋天在美國印第安納州首府印第安納波利斯人們多久會搜索一次“伊拉克”,或者 2007年圣誕季在亞特蘭大的中產(chǎn)階級中搜索最多的關(guān)鍵詞是什么。不過,更為重要的是,通過智能地整合登錄數(shù)據(jù)、 cookies數(shù)據(jù)與 IP地址, Google能夠以極高的準確率將時間跨度很遠的多次搜索請求與某個人關(guān)聯(lián)起來。


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號