在Google誕生以前,傳統(tǒng)搜索引擎主要依靠頁面內(nèi)容中的關(guān)鍵詞匹配搜索詞進(jìn)行排名。這種排名方式的短處現(xiàn)在看來顯而易見,那就是很容易被刻意操縱。黑帽SEO在頁面上堆積關(guān)鍵詞,或加入與主題無關(guān)的熱門關(guān)鍵詞,都能提高排名,使搜索引擎排名結(jié)果質(zhì)量大為下降?,F(xiàn)在的搜索引擎都使用鏈接分析技術(shù)減少垃圾,提高用戶體驗。本節(jié)就簡要探討鏈接在搜索引擎排名中的應(yīng)用原理。
在排名中計入鏈接因素,不僅有助于減少垃圾,提高結(jié)果相關(guān)性,也使傳統(tǒng)關(guān)鍵詞匹配無法排名的文件能夠被處理。比如圖片、視頻文件無法進(jìn)行關(guān)鍵詞匹配,但是卻可能有外部鏈接,通過鏈接信息,搜索引擎就可以了解圖片和視頻的內(nèi)容從而排名。
不同文字的頁面排名也成為可能。比如在百度或google.cn搜索“SEO”,都可以看到英文和其他文字的SEO網(wǎng)站。甚至搜索“搜索引擎優(yōu)化”,也可以看到非中文頁面,原因就在于有的鏈接可能使用“搜索引擎優(yōu)化”為錨文字指向英文頁面。
鏈接因素現(xiàn)在已經(jīng)超過頁面內(nèi)容的重要性。不過理解鏈接關(guān)系比較抽象。頁面上的因素對排名的影響能看得到,容易直觀理解。舉個簡單的例子,搜索一個特定關(guān)鍵詞,SEO人員只要觀察前幾頁結(jié)果,就能看到:關(guān)鍵詞在標(biāo)題標(biāo)簽中出現(xiàn)有什么影響,出現(xiàn)在最前面又有什么影響,有技術(shù)資源的還可以大規(guī)模地統(tǒng)計,計算出關(guān)鍵詞出現(xiàn)在標(biāo)題標(biāo)簽中不同位置與排名之間的關(guān)系。雖然這種關(guān)系不一定是因果關(guān)系,但至少是統(tǒng)計上的聯(lián)系,使SEO人員大致了解如何優(yōu)化。
鏈接對排名的影響就無法直觀了解,也很難進(jìn)行統(tǒng)計,因為沒有人能獲得搜索引擎的鏈接數(shù)據(jù)庫。我們能做的最多只是定性觀察和分析。
下面介紹的一些關(guān)于鏈接的專利,多少透露了鏈接在搜索引擎排名中的使用方法和地位。
2.5.1 李彥宏超鏈分析專利
百度創(chuàng)始人李彥宏在回國創(chuàng)建百度之前就是美國頂級的搜索引擎工程師之一。據(jù)說李彥宏在尋找風(fēng)險投資時,投資人詢問其他三個搜索引擎業(yè)界的技術(shù)高人一個問題:要了解搜索引擎技術(shù)應(yīng)該問誰。這三個被問到的高人中有兩個回答:搜索引擎的事就問李彥宏。由此投資人斷定李彥宏是最了解搜索引擎的人之一。
這其實就是現(xiàn)實生活中類似于鏈接關(guān)系的應(yīng)用。要判斷哪個頁面最具權(quán)威性,不能光看頁面自己怎么說,還要看其他頁面怎么評價。
李彥宏1997年就提交了一份名為“超鏈文件檢索系統(tǒng)和方法”的專利申請,這比Google創(chuàng)始人發(fā)明PR要早得多,不得不說這是非常具有前瞻性的研究工作。在這份專利中,李彥宏提出了與傳統(tǒng)信息檢索系統(tǒng)不同的基于鏈接的排名方法。
這個系統(tǒng)除了索引頁面之外,還建立一個鏈接詞庫,記錄鏈接錨文字的一些相關(guān)信息,如錨文字中包含哪些關(guān)鍵詞,發(fā)出鏈接的頁面索引,包含特定錨文字的鏈接總數(shù),包含特定關(guān)鍵詞的鏈接都指向哪些頁面。詞庫不僅包含關(guān)鍵詞原型,也包含同一個詞干的其他衍生關(guān)鍵詞。
根據(jù)這些鏈接數(shù)據(jù),尤其是錨文字,計算出基于鏈接的文件相關(guān)性。在用戶搜索時,將得到的基于鏈接的相關(guān)性與基于關(guān)鍵詞匹配的傳統(tǒng)相關(guān)性綜合使用,得到更準(zhǔn)確的排名。
在今天看來,這種基于鏈接的相關(guān)性計算是搜索引擎的常態(tài),每個SEO人員都知道。但是在十三四年前,這無疑是非常創(chuàng)新的概念。當(dāng)然現(xiàn)在的搜索引擎算法對鏈接的考慮,已經(jīng)不僅僅是錨文字,實際上要復(fù)雜得多。