正文

《搜》 反向追蹤鏈接(2)

搜(第2版) 作者:(美)約翰·巴特爾


最后,盡管沒(méi)有專門的學(xué)術(shù)術(shù)語(yǔ),不過(guò)學(xué)術(shù)出版是受到等級(jí)這個(gè)概念的推動(dòng)的。對(duì)論文的評(píng)價(jià)不僅僅根據(jù)其中的原創(chuàng)性思想和嚴(yán)格的引經(jīng)據(jù)典,還有賴于它所引用的論文的數(shù)量、后來(lái)引用它的論文的數(shù)量,以及一般認(rèn)為的這些引文的重要性。這樣的做法導(dǎo)致了學(xué)術(shù)文獻(xiàn)引用的通貨膨脹(冗長(zhǎng)的、毫無(wú)意義的引用),還有互相吹捧式的引用(如果你引用我的,我就引用你的)。盡管如此,這種做法的確為每一篇給定的論文提供了嚴(yán)格的等級(jí)評(píng)定。事實(shí)上,以加菲爾德為代表的很多人都已經(jīng)證明,某一篇給定論文的重要性可以根據(jù)有多少篇論文通過(guò)引用而同它建立聯(lián)系來(lái)確定。

學(xué)術(shù)出版是一個(gè)以同行評(píng)審、引文編寫和注評(píng)為核心的、或許存在些許瑕疵但行之有效的體系。這個(gè)體系為已出版的論文提供了一種等級(jí)評(píng)定的方法。

這個(gè)說(shuō)法很公允??墒牵勥@些的意義何在?

蒂姆.伯納斯-李正是因?yàn)橄胍ㄟ^(guò)技術(shù)和超文本網(wǎng)絡(luò)來(lái)改進(jìn)這個(gè)體系的缺陷才會(huì)發(fā)明了萬(wàn)維網(wǎng)。而拉里.佩奇和謝爾蓋.布林正是因?yàn)樵噲D改進(jìn)伯納斯-李建立的萬(wàn)維網(wǎng)才創(chuàng)造了Google。將所有這些工作串在一起的就是文獻(xiàn)引用―通過(guò)指向他人的成果來(lái)建立自己的成果的做法。

佩奇的推論是,整個(gè)網(wǎng)絡(luò)就是由引用和注評(píng)構(gòu)成的松散體系。畢竟,鏈接不就是引用嗎?而鏈接描述文字不就是注評(píng)嗎?根據(jù)佩奇的說(shuō)法,如果他能夠找到一種方法來(lái)計(jì)算方向鏈接的數(shù)量和衡量它的質(zhì)量,那么“網(wǎng)絡(luò)就會(huì)成為一個(gè)更有價(jià)值的地方”。

佩奇接著說(shuō):“從某種意義上來(lái)講,網(wǎng)絡(luò)就是這樣一個(gè)地方:在這里每個(gè)人都可以很容易地通過(guò)建立一個(gè)鏈接來(lái)為任何事做注評(píng)??墒?,早期的超文本有一個(gè)悲劇性的缺陷―你不能夠反向追蹤鏈接。BackRub項(xiàng)目就是要做反向追蹤,搜集網(wǎng)絡(luò)上所有的鏈接再把它們倒回去是一件感覺(jué)很酷的事?!?/p>

佩奇把他的項(xiàng)目稱為BackRub,這個(gè)項(xiàng)目旨在發(fā)現(xiàn)網(wǎng)絡(luò)中的鏈接,存儲(chǔ)它們以進(jìn)行分析,然后在網(wǎng)上重新發(fā)布它們。不過(guò),通過(guò)再次發(fā)布的鏈接,任何人都可以知道到底有誰(shuí)同網(wǎng)絡(luò)上的任何給定網(wǎng)頁(yè)建立鏈接。不管從哪個(gè)角度來(lái)看,這都是一個(gè)雄心勃勃的計(jì)劃。但是,佩奇一開始就沒(méi)有讓BackRub在數(shù)量有限的測(cè)試網(wǎng)頁(yè)上工作。恰恰相反,他目標(biāo)遠(yuǎn)大:為什么不一下子解決所有問(wèn)題呢,直接在整個(gè)萬(wàn)維網(wǎng)上做?

要完成這樣一個(gè)任務(wù)需要非同尋常的、無(wú)所畏懼的投入。盡管佩奇只是打算儲(chǔ)存鏈接而不是整個(gè)網(wǎng)絡(luò)的內(nèi)容,但他還是需要搜索整個(gè)網(wǎng)絡(luò)來(lái)找到這些鏈接。在1995年,這樣的做法1995年首先做此嘗試的人是使用DEC公司的資源發(fā)布Alta Vista的路易斯.莫尼爾。 還很少見(jiàn)。

當(dāng)佩奇構(gòu)思BackRub的時(shí)候,網(wǎng)絡(luò)文件總數(shù)據(jù)估算大約有1 000萬(wàn),而連接它們的鏈接數(shù)量還是未知的。佩奇估計(jì)鏈接數(shù)量大概是1億個(gè)左右,而實(shí)際的數(shù)量后來(lái)證明遠(yuǎn)大于此。而且,佩奇在開始工作之前耽擱的時(shí)間越久,網(wǎng)絡(luò)就會(huì)變得越大。早期,網(wǎng)絡(luò)增長(zhǎng)速度是每年2 000%還多。要捕獲這樣一頭巨獸所需要的計(jì)算機(jī)處理資源非常龐大,遠(yuǎn)超出了一個(gè)普通的學(xué)生項(xiàng)目所能負(fù)擔(dān)的程度。佩奇開始設(shè)計(jì)他自己的網(wǎng)頁(yè)捕獲器時(shí),但還不完全明白自己這樣做的后果。

這個(gè)想法的復(fù)雜性和規(guī)模性吸引了布林。到目前為止,這個(gè)多面手還是不停地從一個(gè)項(xiàng)目跳到另一個(gè)項(xiàng)目,遲遲不肯確定一個(gè)論文選題。他發(fā)現(xiàn)支撐Backrub項(xiàng)目的前提頗具吸引力。布林回憶說(shuō),“我在學(xué)校里,同許多課題小組討論過(guò)他們的課題,而這一個(gè)是最讓人興奮的項(xiàng)目。不僅僅因?yàn)檫@個(gè)項(xiàng)目以代表人類知識(shí)的互聯(lián)網(wǎng)為研究對(duì)象,還因?yàn)槲蚁矚g拉里和他的小組里的另外兩個(gè)人?!?/p>

同佩奇和布林一同工作的另外兩個(gè)人是斯科特.哈桑和艾倫.斯特姆伯格,他們是被派到這個(gè)項(xiàng)目的博士生助手。(每位博士學(xué)位申請(qǐng)人都會(huì)分配到一兩名助手;助手的職位是由想賺點(diǎn)外快的碩士研究生來(lái)?yè)?dān)當(dāng)?shù)?。)哈桑和斯特姆伯格都在Google真正起步之前離開了這個(gè)項(xiàng)目。但是,即使是這些中途離開的人后來(lái)也創(chuàng)辦了成功的互聯(lián)網(wǎng)公司。哈桑同拉里的哥哥卡爾.佩奇一起創(chuàng)立了eGroupcom,后來(lái)把公司以超過(guò)5 000萬(wàn)美元的價(jià)格出售給了雅虎。斯特姆伯格在密歇根讀大學(xué)時(shí)就已經(jīng)發(fā)布了一個(gè)很受歡迎的天氣網(wǎng)站W(wǎng)eather Underground,而且現(xiàn)在還在經(jīng)營(yíng)這個(gè)網(wǎng)站。


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)