PR是PageRank的縮寫。Google PR理論是所有基于鏈接的搜索引擎理論中最有名的。SEO人員可能不清楚本節(jié)介紹的其他鏈接理論,但不可能不知道PR。
PR是Google創(chuàng)始人之一拉里佩奇發(fā)明的,用于表示頁面重要性的概念。用最簡單的話說就是,反向鏈接越多的頁面就是越重要的頁面,因此PR值也就越高。
Google PR有點(diǎn)類似于科技文獻(xiàn)中互相引用的概念,被其他文獻(xiàn)引用較多的文獻(xiàn),很可能是比較重要的文獻(xiàn)。
1.PR的概念和計(jì)算
我們可以把互聯(lián)網(wǎng)理解為由結(jié)點(diǎn)及鏈接組成的有向圖,頁面就是一個個結(jié)點(diǎn),頁面之間的有向鏈接傳遞著頁面的重要性。一個鏈接傳遞的PR值決定于導(dǎo)入鏈接所在頁面的PR值,發(fā)出鏈接的頁面本身PR值越高,所能傳遞出去的PR也越高。傳遞的PR數(shù)值也取決于頁面上的導(dǎo)出鏈接數(shù)目。對于給定PR值的頁面來說,假設(shè)能傳遞到下級頁面100份PR,頁面上有10個導(dǎo)出鏈接,每個鏈接能傳遞10份PR,頁面上有20個導(dǎo)出鏈接的話,每個鏈接只能傳遞5份PR。所以一個頁面的PR值取決于導(dǎo)入鏈接總數(shù),發(fā)出鏈接頁面的PR值,以及發(fā)出鏈接頁面上的導(dǎo)出鏈接數(shù)目。
PR值計(jì)算公式是
PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn))
· A代表頁面A。
· PR(A)則代表頁面A的PR值。
· d為阻尼指數(shù)。通常認(rèn)為d=0.85。
· t1...tn代表鏈接向頁面A的頁面t1到tn。
· C代表頁面上的導(dǎo)出鏈接數(shù)目。C(t1)即為頁面t1上的導(dǎo)出鏈接數(shù)目。
從概念及計(jì)算公式都可以看到,計(jì)算PR值必須使用迭代計(jì)算。頁面A的PR值取決于鏈接向A的頁面t1至tn頁面的PR值,而t1至tn頁面的PR值又取決于其他頁面的PR值,其中很可能還包含頁面A。所以PR需要多次迭代才能得到。計(jì)算時先給所有頁面設(shè)定一個初始值,經(jīng)過一定次數(shù)的迭代計(jì)算后,各個頁面的PR值將趨于穩(wěn)定。研究證明,無論初始值怎么選取,經(jīng)過迭代計(jì)算的最終PR值不會受到影響。
外部頁面Y向循環(huán)注入PR值,循環(huán)中的頁面不停迭代傳遞PR,如果沒有阻尼系數(shù),循環(huán)中的頁面PR將達(dá)到無窮大。引入阻尼系數(shù),使PR在傳遞時自然衰減,才能將PR計(jì)算穩(wěn)定在一個值上。
2.PR的兩個比喻模型
關(guān)于PR有兩個著名的比喻。一個比喻是投票。鏈接就像民主投票一樣,A頁面鏈接到B頁面,就意味著A頁面對B頁面投了一票,使得B頁面的重要性提高。同時,A頁面本身的PR值決定了A所能投出去的投票力,PR值越高的頁面,投出的票也更重要。在這個意義上,傳統(tǒng)基于關(guān)鍵詞匹配的算法是看頁面自己說頁面內(nèi)容是什么,基于鏈接的PR則是看別人怎么評價(jià)一個頁面。
第二個比喻是隨機(jī)沖浪比喻。假設(shè)一個訪問者從一個頁面開始,不停地隨機(jī)點(diǎn)擊鏈接,訪問下一個頁面。有時候這個用戶感到無聊了,不再點(diǎn)擊鏈接,就隨機(jī)跳到了另外一個網(wǎng)址,再次開始不停地向下點(diǎn)擊。所謂PR值,也就是一個頁面在這種隨機(jī)沖浪訪問中被訪問到的概率。一個頁面導(dǎo)入鏈接越多,被訪問到的概率也越高,因此PR值也越高。
阻尼系數(shù)也與隨機(jī)沖浪模型有關(guān)。(1-d)=0.15實(shí)際上就是用戶感到無聊,停止點(diǎn)擊,隨機(jī)跳到新URL的概率。