正文

PageRank——讓谷歌騰飛的技術(shù)(3)

改變未來的九大算法 作者:(美)約翰·麥考密克


權(quán)重把戲

你可能已經(jīng)在想,為什么要對(duì)網(wǎng)頁的所有鏈入鏈接一視同仁。來自專家的推薦肯定就要比菜鳥的推薦更有價(jià)值?要細(xì)致地理解這一點(diǎn),我們繼續(xù)研究上面的炒蛋例子,不過研究的是另一組鏈入鏈接。下頁的圖對(duì)鏈入鏈接進(jìn)行了重新設(shè)置:現(xiàn)在,伯特和歐尼的菜譜的鏈入鏈接數(shù)相等了(只有一個(gè)),但歐尼的鏈入鏈接來自我的主頁,而伯特的則來自于著名主廚艾利斯·沃特斯。

如果沒有其他信息,你更喜歡哪個(gè)菜譜?很顯然,選擇由一位著名主廚推薦的菜譜,要比選擇由一名計(jì)算機(jī)科學(xué)相關(guān)書籍作者推薦的菜譜更好。我們稱這一基本原則為“權(quán)重把戲”(the authority trick):來自高“權(quán)重”網(wǎng)頁的鏈接排名要比來自低“權(quán)重”網(wǎng)頁鏈接的排名高。

這個(gè)原則很好,但其實(shí)際形式對(duì)搜索引擎而言一點(diǎn)用都沒有。計(jì)算機(jī)如何才能自動(dòng)判定艾利斯·沃特斯在炒蛋方面比我更具有權(quán)威性呢?有個(gè)想法對(duì)此也許會(huì)有所幫助:讓我們把超鏈接把戲和權(quán)重把戲結(jié)合起來。所有網(wǎng)頁的初始權(quán)重值(authority score)都是1,但如果一個(gè)網(wǎng)頁有鏈入鏈接,在計(jì)算該網(wǎng)頁權(quán)重時(shí)就要加入指向其的網(wǎng)頁的權(quán)重。也就是說,如果X和Y網(wǎng)頁鏈向Z網(wǎng)頁,那么Z網(wǎng)頁的權(quán)重就是X網(wǎng)頁和Y網(wǎng)頁權(quán)重相加的值。

下面的圖在計(jì)算這兩個(gè)炒蛋菜譜網(wǎng)頁的權(quán)重值上很詳細(xì)。終值顯示在圓圈中。圖中有兩個(gè)網(wǎng)頁鏈向我的主頁;這些網(wǎng)頁本身沒有鏈入鏈接,因此權(quán)重值為1。我的主頁的權(quán)重值是所有鏈入鏈接權(quán)重值的總和,相加得2。艾利斯·沃特斯的主頁有100個(gè)鏈入鏈接,每個(gè)鏈入鏈接的權(quán)重值為1,因此它的權(quán)重是100。歐尼的菜譜只有一個(gè)鏈入鏈接,但這個(gè)鏈入鏈接的權(quán)重值是2,因此將其所有鏈入鏈接的權(quán)重值相加(這個(gè)例子中只有一個(gè)數(shù)可加),歐尼菜譜網(wǎng)頁的權(quán)重值為2。伯特菜譜網(wǎng)頁也只有一個(gè)鏈入鏈接,但其權(quán)重值為100,因此伯特菜譜網(wǎng)頁的權(quán)重值為100。而因?yàn)?00大于2,所以伯特的網(wǎng)頁排名要比歐尼的高。

隨機(jī)訪問者把戲

就自動(dòng)計(jì)算權(quán)重值來說,我們似乎擁有了一個(gè)真正奏效的策略,無須計(jì)算機(jī)真正地理解網(wǎng)頁內(nèi)容。不幸的是,這種方法有個(gè)大問題。超鏈接很有可能形成被計(jì)算機(jī)科學(xué)家稱為“循環(huán)”(cycle)的東西。循環(huán)指訪問者可以通過點(diǎn)擊超鏈接返回出發(fā)時(shí)的網(wǎng)頁。


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)