正文

《搜》 神秘技術(shù)配方(1)

搜(第2版) 作者:(美)約翰·巴特爾


佩奇告訴我,他從來就沒有打算過要?jiǎng)?chuàng)造出一個(gè)搜索引擎。他和布林確實(shí)不清楚這個(gè)項(xiàng)目最后會(huì)有什么用途。但是為了建立BackRub,他們一定要搜索網(wǎng)絡(luò)。1996年3月,佩奇把網(wǎng)頁(yè)捕獲器指向一張網(wǎng)頁(yè)―他自己在斯坦福的主頁(yè)(大部分計(jì)算機(jī)專業(yè)的研究生都有自己的主頁(yè)),然后把它放出去覓食,網(wǎng)頁(yè)捕獲器就從那里開始工作。這就是網(wǎng)絡(luò)的美麗之處,不管你從何處開始,最終你總是可以到達(dá)幾乎每一個(gè)角落。

搜索整個(gè)網(wǎng)絡(luò),然后計(jì)算出一共有多少個(gè)鏈接是他們主要的任務(wù)。不過,BackRub的創(chuàng)新之處絕不僅僅在網(wǎng)頁(yè)捕獲。佩奇很自然地注意到了學(xué)術(shù)出版的評(píng)級(jí)概念,他提出了這樣的理論:網(wǎng)絡(luò)圖的結(jié)構(gòu)不僅可以顯示誰鏈接當(dāng)我問起斯特姆伯格的靈感所在時(shí),他說:“我想拉里只是想知道到底都有誰鏈接了他的網(wǎng)站?!绷苏l,更關(guān)鍵的是,可以根據(jù)進(jìn)行鏈接行為的網(wǎng)站的各種屬性決定這個(gè)鏈接的重要性。我們先前提過,這些屬性――也就是像鏈接周圍的錨文本之類的東西,對(duì)于等級(jí)和相關(guān)性的確定也非常關(guān)鍵。

如果BackRub知道一個(gè)網(wǎng)站的重要性,就可以給它一個(gè)相對(duì)的等級(jí)。對(duì)于任何一個(gè)給定的網(wǎng)站,我們不但可以知道哪些網(wǎng)頁(yè)上的鏈接指向它,還可以知道這些鏈接的評(píng)級(jí)。佩奇想,這當(dāng)然是有用的。

佩奇和布林研究的一個(gè)重要原則就是要有用,這也是后來Google所有的產(chǎn)品開發(fā)必須遵循的原則。他們當(dāng)時(shí)還沒有最終確定要在BackRub的基礎(chǔ)之上創(chuàng)立一家公司,但是佩奇對(duì)特斯拉的教訓(xùn)一直銘記于心?!拔业哪繕?biāo)是為了進(jìn)行實(shí)實(shí)在在的有趣的學(xué)術(shù)研究?!迸迤婊貞浀溃骸暗亲鰶]有什么實(shí)踐價(jià)值的所謂學(xué)術(shù)研究是沒有道理的,有許多研究課題既有趣又實(shí)際。這兩者我都要,我不認(rèn)為追求實(shí)用性需要犧牲什么。我想如果我真的發(fā)明出能夠造福許多人的東西……我一定不會(huì)反對(duì)把它商業(yè)化,我不想最后像特斯拉那樣。”

佩奇和布林完成網(wǎng)絡(luò)搜索并存儲(chǔ)了鏈接圖之后,他們面臨的問題是找到評(píng)定等級(jí)的方法。受到文獻(xiàn)引用分析的啟發(fā),佩奇構(gòu)建了自己的理論,認(rèn)為計(jì)算所有指向某網(wǎng)頁(yè)的鏈接數(shù)量對(duì)于確定這張網(wǎng)頁(yè)的等級(jí)具有指導(dǎo)意義。但是這樣一種方式帶來了新的挑戰(zhàn)―困難的遞歸性數(shù)學(xué)運(yùn)算,因?yàn)椴还庖?jì)算一張網(wǎng)頁(yè)上的鏈接數(shù)量,還要計(jì)算同這些鏈接連接的鏈接的數(shù)量。很快,運(yùn)算變得非常復(fù)雜。


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)