正文

PageRank——讓谷歌騰飛的技術(shù)(1)

改變未來的九大算法 作者:(美)約翰·麥考密克


《星際迷航》(Star Trek)中的計(jì)算機(jī)并不特別讓人感興趣。他們向計(jì)算機(jī)提問題,計(jì)算機(jī)還要想一會兒。我覺得我們能做得更好。

——拉里·佩奇(谷歌聯(lián)合創(chuàng)始人)

從建筑學(xué)的角度來說,車庫基本上是個(gè)簡陋的地方。但在硅谷,車庫有一種特殊的創(chuàng)業(yè)含義:許多偉大的硅谷技術(shù)公司在此誕生或至少從車庫中孵化而來。這一趨勢并非從20世紀(jì)90年代的互聯(lián)網(wǎng)泡沫開始。在互聯(lián)網(wǎng)泡沫出現(xiàn)的50多年前,也就是1939年,當(dāng)世界經(jīng)濟(jì)仍未從大蕭條的影響中走出來時(shí),惠普(Hewlett-Packard)就在加利福尼亞州帕洛阿爾托(Palo Alto)戴夫·休利特(Dave Hewlett)的車庫中逐漸成形了。幾十年之后,史蒂夫·喬布斯(Steve Jobs)和史蒂夫·沃茲尼亞克(Steve Wozniak)于1976年在加利福尼亞州洛斯拉圖斯喬布斯的車庫中創(chuàng)業(yè),之后創(chuàng)建了今天傳奇的蘋果計(jì)算機(jī)公司。(盡管傳說蘋果公司創(chuàng)辦于車庫,喬布斯和沃茲尼亞克一開始其實(shí)是從一間臥室開始的。空間很快就不夠用了,于是他們轉(zhuǎn)移到了車庫。)不過,和惠普和蘋果的成功故事相比,一個(gè)名為谷歌的搜索引擎的創(chuàng)辦過程更令人驚嘆。谷歌從加利福尼亞州門洛帕克市的一間車庫開始,并于1998年9月注冊成立公司。

那時(shí),谷歌事實(shí)上已經(jīng)運(yùn)營自己的搜索引擎一年多了——最開始是在斯坦福大學(xué)的服務(wù)器上,谷歌的兩位聯(lián)合創(chuàng)始人都是斯坦福博士生。直到斯坦福大學(xué)再也不能承受這一日益受歡迎的服務(wù)所需要的帶寬,拉里·佩奇和謝爾蓋·布林才把公司轉(zhuǎn)移到了如今著名的門洛帕克車庫。他們肯定做了些正確的事,因?yàn)樵谒麄冋匠闪⒐?個(gè)月后,美國《個(gè)人計(jì)算機(jī)雜志》(PC Magazine)就宣布谷歌是1998年美國排名前一百的網(wǎng)站之一。

這也是我們的故事真正開始的地方:在當(dāng)年《個(gè)人計(jì)算機(jī)雜志》的評論中,谷歌的精英管理層因?yàn)楣雀琛耙猿鯇こ5募记煞祷叵嚓P(guān)度極高的結(jié)果”而獲獎(jiǎng)。你也許還記得上一章提到過,第一個(gè)商業(yè)搜索引擎于4年前的1994年發(fā)布。還在車庫里的谷歌怎么能彌補(bǔ)4年的巨大差距,在搜索質(zhì)量上超越已經(jīng)很受歡迎的Lycos和AltaVista呢?這一問題的答案可不簡單。但最重要的因素之一——尤其是在網(wǎng)絡(luò)搜索早期——就是谷歌用來對其搜索結(jié)果進(jìn)行排名的創(chuàng)新算法:一個(gè)被稱為PageRank的著名算法。

“PageRank”是個(gè)雙關(guān)詞:它既是一種對網(wǎng)頁排名的算法,也是其主要發(fā)明者拉里·佩奇的排名算法。佩奇和布林在1998年的一篇學(xué)術(shù)會議論文《解析大規(guī)模超文本網(wǎng)絡(luò)搜索引擎》(the Anatomy of a Large-Scale Hypertextual Web Search Engine)中發(fā)表了這一算法。正如論文標(biāo)題所暗示的,這篇論文的內(nèi)容不止是描述PageRank。事實(shí)上,這是對1998年存在的谷歌系統(tǒng)的完整描述。但藏在這一系統(tǒng)技術(shù)細(xì)節(jié)中的,是對也許是21世紀(jì)出現(xiàn)的第一個(gè)算法瑰寶的描述:PageRank算法。在本章,我們將探索這一算法如何以及為什么能在草垛中尋針,并持續(xù)為搜索查詢提供最相關(guān)的結(jié)果——也是排名最靠前的命中。


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號