PR是PageRank的縮寫(xiě)。Google PR理論是所有基于鏈接的搜索引擎理論中最有名的。SEO人員可能不清楚本節(jié)介紹的其他鏈接理論,但不可能不知道PR。
PR是Google創(chuàng)始人之一拉里佩奇發(fā)明的,用于表示頁(yè)面重要性的概念。用最簡(jiǎn)單的話說(shuō)就是,反向鏈接越多的頁(yè)面就是越重要的頁(yè)面,因此PR值也就越高。
Google PR有點(diǎn)類似于科技文獻(xiàn)中互相引用的概念,被其他文獻(xiàn)引用較多的文獻(xiàn),很可能是比較重要的文獻(xiàn)。
1.PR的概念和計(jì)算
我們可以把互聯(lián)網(wǎng)理解為由結(jié)點(diǎn)及鏈接組成的有向圖,頁(yè)面就是一個(gè)個(gè)結(jié)點(diǎn),頁(yè)面之間的有向鏈接傳遞著頁(yè)面的重要性。一個(gè)鏈接傳遞的PR值決定于導(dǎo)入鏈接所在頁(yè)面的PR值,發(fā)出鏈接的頁(yè)面本身PR值越高,所能傳遞出去的PR也越高。傳遞的PR數(shù)值也取決于頁(yè)面上的導(dǎo)出鏈接數(shù)目。對(duì)于給定PR值的頁(yè)面來(lái)說(shuō),假設(shè)能傳遞到下級(jí)頁(yè)面100份PR,頁(yè)面上有10個(gè)導(dǎo)出鏈接,每個(gè)鏈接能傳遞10份PR,頁(yè)面上有20個(gè)導(dǎo)出鏈接的話,每個(gè)鏈接只能傳遞5份PR。所以一個(gè)頁(yè)面的PR值取決于導(dǎo)入鏈接總數(shù),發(fā)出鏈接頁(yè)面的PR值,以及發(fā)出鏈接頁(yè)面上的導(dǎo)出鏈接數(shù)目。
PR值計(jì)算公式是
PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn))
· A代表頁(yè)面A。
· PR(A)則代表頁(yè)面A的PR值。
· d為阻尼指數(shù)。通常認(rèn)為d=0.85。
· t1...tn代表鏈接向頁(yè)面A的頁(yè)面t1到tn。
· C代表頁(yè)面上的導(dǎo)出鏈接數(shù)目。C(t1)即為頁(yè)面t1上的導(dǎo)出鏈接數(shù)目。
從概念及計(jì)算公式都可以看到,計(jì)算PR值必須使用迭代計(jì)算。頁(yè)面A的PR值取決于鏈接向A的頁(yè)面t1至tn頁(yè)面的PR值,而t1至tn頁(yè)面的PR值又取決于其他頁(yè)面的PR值,其中很可能還包含頁(yè)面A。所以PR需要多次迭代才能得到。計(jì)算時(shí)先給所有頁(yè)面設(shè)定一個(gè)初始值,經(jīng)過(guò)一定次數(shù)的迭代計(jì)算后,各個(gè)頁(yè)面的PR值將趨于穩(wěn)定。研究證明,無(wú)論初始值怎么選取,經(jīng)過(guò)迭代計(jì)算的最終PR值不會(huì)受到影響。
外部頁(yè)面Y向循環(huán)注入PR值,循環(huán)中的頁(yè)面不停迭代傳遞PR,如果沒(méi)有阻尼系數(shù),循環(huán)中的頁(yè)面PR將達(dá)到無(wú)窮大。引入阻尼系數(shù),使PR在傳遞時(shí)自然衰減,才能將PR計(jì)算穩(wěn)定在一個(gè)值上。
2.PR的兩個(gè)比喻模型
關(guān)于PR有兩個(gè)著名的比喻。一個(gè)比喻是投票。鏈接就像民主投票一樣,A頁(yè)面鏈接到B頁(yè)面,就意味著A頁(yè)面對(duì)B頁(yè)面投了一票,使得B頁(yè)面的重要性提高。同時(shí),A頁(yè)面本身的PR值決定了A所能投出去的投票力,PR值越高的頁(yè)面,投出的票也更重要。在這個(gè)意義上,傳統(tǒng)基于關(guān)鍵詞匹配的算法是看頁(yè)面自己說(shuō)頁(yè)面內(nèi)容是什么,基于鏈接的PR則是看別人怎么評(píng)價(jià)一個(gè)頁(yè)面。
第二個(gè)比喻是隨機(jī)沖浪比喻。假設(shè)一個(gè)訪問(wèn)者從一個(gè)頁(yè)面開(kāi)始,不停地隨機(jī)點(diǎn)擊鏈接,訪問(wèn)下一個(gè)頁(yè)面。有時(shí)候這個(gè)用戶感到無(wú)聊了,不再點(diǎn)擊鏈接,就隨機(jī)跳到了另外一個(gè)網(wǎng)址,再次開(kāi)始不停地向下點(diǎn)擊。所謂PR值,也就是一個(gè)頁(yè)面在這種隨機(jī)沖浪訪問(wèn)中被訪問(wèn)到的概率。一個(gè)頁(yè)面導(dǎo)入鏈接越多,被訪問(wèn)到的概率也越高,因此PR值也越高。
阻尼系數(shù)也與隨機(jī)沖浪模型有關(guān)。(1-d)=0.15實(shí)際上就是用戶感到無(wú)聊,停止點(diǎn)擊,隨機(jī)跳到新URL的概率。