權(quán)重把戲
你可能已經(jīng)在想,為什么要對網(wǎng)頁的所有鏈入鏈接一視同仁。來自專家的推薦肯定就要比菜鳥的推薦更有價值?要細致地理解這一點,我們繼續(xù)研究上面的炒蛋例子,不過研究的是另一組鏈入鏈接。下頁的圖對鏈入鏈接進行了重新設(shè)置:現(xiàn)在,伯特和歐尼的菜譜的鏈入鏈接數(shù)相等了(只有一個),但歐尼的鏈入鏈接來自我的主頁,而伯特的則來自于著名主廚艾利斯·沃特斯。
如果沒有其他信息,你更喜歡哪個菜譜?很顯然,選擇由一位著名主廚推薦的菜譜,要比選擇由一名計算機科學相關(guān)書籍作者推薦的菜譜更好。我們稱這一基本原則為“權(quán)重把戲”(the authority trick):來自高“權(quán)重”網(wǎng)頁的鏈接排名要比來自低“權(quán)重”網(wǎng)頁鏈接的排名高。
這個原則很好,但其實際形式對搜索引擎而言一點用都沒有。計算機如何才能自動判定艾利斯·沃特斯在炒蛋方面比我更具有權(quán)威性呢?有個想法對此也許會有所幫助:讓我們把超鏈接把戲和權(quán)重把戲結(jié)合起來。所有網(wǎng)頁的初始權(quán)重值(authority score)都是1,但如果一個網(wǎng)頁有鏈入鏈接,在計算該網(wǎng)頁權(quán)重時就要加入指向其的網(wǎng)頁的權(quán)重。也就是說,如果X和Y網(wǎng)頁鏈向Z網(wǎng)頁,那么Z網(wǎng)頁的權(quán)重就是X網(wǎng)頁和Y網(wǎng)頁權(quán)重相加的值。
下面的圖在計算這兩個炒蛋菜譜網(wǎng)頁的權(quán)重值上很詳細。終值顯示在圓圈中。圖中有兩個網(wǎng)頁鏈向我的主頁;這些網(wǎng)頁本身沒有鏈入鏈接,因此權(quán)重值為1。我的主頁的權(quán)重值是所有鏈入鏈接權(quán)重值的總和,相加得2。艾利斯·沃特斯的主頁有100個鏈入鏈接,每個鏈入鏈接的權(quán)重值為1,因此它的權(quán)重是100。歐尼的菜譜只有一個鏈入鏈接,但這個鏈入鏈接的權(quán)重值是2,因此將其所有鏈入鏈接的權(quán)重值相加(這個例子中只有一個數(shù)可加),歐尼菜譜網(wǎng)頁的權(quán)重值為2。伯特菜譜網(wǎng)頁也只有一個鏈入鏈接,但其權(quán)重值為100,因此伯特菜譜網(wǎng)頁的權(quán)重值為100。而因為100大于2,所以伯特的網(wǎng)頁排名要比歐尼的高。
隨機訪問者把戲
就自動計算權(quán)重值來說,我們似乎擁有了一個真正奏效的策略,無須計算機真正地理解網(wǎng)頁內(nèi)容。不幸的是,這種方法有個大問題。超鏈接很有可能形成被計算機科學家稱為“循環(huán)”(cycle)的東西。循環(huán)指訪問者可以通過點擊超鏈接返回出發(fā)時的網(wǎng)頁。