正文

《搜》 神秘技術(shù)配方(3)

搜(第2版) 作者:(美)約翰·巴特爾


佩奇和布林很快就發(fā)現(xiàn)BackRub的搜索結(jié)果要優(yōu)于Alta Vista和Excite這些傳統(tǒng)的搜索引擎,因?yàn)樗鼈兂37答伜敛幌嚓P(guān)的結(jié)果。佩奇回憶說:“那時我們想,為什么它們會反饋明顯無關(guān)緊要的結(jié)果呢?因?yàn)樗鼈冎皇强粗匚谋径雎粤似渌盘?。一旦掌握了它,你就會清楚知道這個信號對搜索有多么重要。”

這個信號,也就是現(xiàn)在我們所知道的PageRank,促成Google建立的神秘技術(shù)配方。為了檢驗(yàn)PageRank在用于用戶搜索程序的時候是否有效,佩奇和布林一起編寫了一個BackRub搜索工具。它只檢索URL中的文字,然后運(yùn)用PageRank來為結(jié)果的相關(guān)性進(jìn)行排序。即使這樣,它所提供的結(jié)果也比傳統(tǒng)搜索引擎好得多,因?yàn)閭鹘y(tǒng)搜索引擎只根據(jù)關(guān)鍵詞排序。這時候,佩奇和布林知道他們做成了一件了不起的事。

這個引擎不光是好用,而且隨著網(wǎng)絡(luò)的發(fā)展壯大它會越變越好。PageRank通過分析鏈接來工作,所以網(wǎng)絡(luò)越大鏈接就越多,引擎提供的結(jié)果就更準(zhǔn)確。這個事實(shí)促使這兩位發(fā)明人給他們的新引擎命名Google。這是googol的變體,googol代表“1”后面跟100個“0”。1996年8月,他們在斯坦福的網(wǎng)站上發(fā)布了Google的第一個版本。

在斯坦福內(nèi)部的一小批人中間,Google轟動一時。備受鼓舞的佩奇和布林開始改進(jìn)他們的服務(wù),在索引中加入全文搜索和更多網(wǎng)頁。然而,搜索引擎要求驚人數(shù)量的計(jì)算機(jī)處理資源。研究生通常沒有錢去購買新的計(jì)算機(jī),佩奇和布林也不例外。他們借錢建成了Google―從網(wǎng)絡(luò)試驗(yàn)室弄來一塊硬盤,從計(jì)算機(jī)科學(xué)裝配中心弄來一個閑置的CPU。他們把佩奇的宿舍改裝成計(jì)算機(jī)實(shí)驗(yàn)室,把那些零部件組裝成一個計(jì)算機(jī)怪物,然后把它整個接入斯坦福的校園寬帶網(wǎng)。在往佩奇的房間里塞滿設(shè)備之后,這兩個年輕的學(xué)生又把布林的房間改裝成辦公室和編程中心。

據(jù)佩奇說,這個項(xiàng)目的另一位導(dǎo)師――赫克托.加西亞-莫利納借給這些學(xué)生一臺Sun Ultra工作站,它的內(nèi)存是普通個人電腦的10倍。但是即使這樣還是不夠用,為工作獲取設(shè)備資源幾乎成了全職的工作?!拔覀儚钠渌n題組討來硬盤和連接元件,因?yàn)槲覀円幚硖鄶?shù)據(jù)了。”佩奇說,“我們不得不請求他們開放他們的布線室,借給我們以太網(wǎng)網(wǎng)卡?!?/p>

拉里.佩奇發(fā)給特里.維諾格拉德的一封電子郵件可以說明他們遇到的問題。日期是1996年7月15日,下面是它的一部分:

我?guī)缀鯖]有任何硬盤空間了。我大概下載了……2 400萬個不同的URL,1億個鏈接。我想我大概還需要8G的空間來儲存它們……現(xiàn)在的零售價是1 000美元4G……而我只儲存了全部網(wǎng)頁的15%,不過這個工作看來前景很不錯。


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號