在Google誕生以前,傳統(tǒng)搜索引擎主要依靠頁面內容中的關鍵詞匹配搜索詞進行排名。這種排名方式的短處現(xiàn)在看來顯而易見,那就是很容易被刻意操縱。黑帽SEO在頁面上堆積關鍵詞,或加入與主題無關的熱門關鍵詞,都能提高排名,使搜索引擎排名結果質量大為下降?,F(xiàn)在的搜索引擎都使用鏈接分析技術減少垃圾,提高用戶體驗。本節(jié)就簡要探討鏈接在搜索引擎排名中的應用原理。
在排名中計入鏈接因素,不僅有助于減少垃圾,提高結果相關性,也使傳統(tǒng)關鍵詞匹配無法排名的文件能夠被處理。比如圖片、視頻文件無法進行關鍵詞匹配,但是卻可能有外部鏈接,通過鏈接信息,搜索引擎就可以了解圖片和視頻的內容從而排名。
不同文字的頁面排名也成為可能。比如在百度或google.cn搜索“SEO”,都可以看到英文和其他文字的SEO網站。甚至搜索“搜索引擎優(yōu)化”,也可以看到非中文頁面,原因就在于有的鏈接可能使用“搜索引擎優(yōu)化”為錨文字指向英文頁面。
鏈接因素現(xiàn)在已經超過頁面內容的重要性。不過理解鏈接關系比較抽象。頁面上的因素對排名的影響能看得到,容易直觀理解。舉個簡單的例子,搜索一個特定關鍵詞,SEO人員只要觀察前幾頁結果,就能看到:關鍵詞在標題標簽中出現(xiàn)有什么影響,出現(xiàn)在最前面又有什么影響,有技術資源的還可以大規(guī)模地統(tǒng)計,計算出關鍵詞出現(xiàn)在標題標簽中不同位置與排名之間的關系。雖然這種關系不一定是因果關系,但至少是統(tǒng)計上的聯(lián)系,使SEO人員大致了解如何優(yōu)化。
鏈接對排名的影響就無法直觀了解,也很難進行統(tǒng)計,因為沒有人能獲得搜索引擎的鏈接數(shù)據(jù)庫。我們能做的最多只是定性觀察和分析。
下面介紹的一些關于鏈接的專利,多少透露了鏈接在搜索引擎排名中的使用方法和地位。
2.5.1 李彥宏超鏈分析專利
百度創(chuàng)始人李彥宏在回國創(chuàng)建百度之前就是美國頂級的搜索引擎工程師之一。據(jù)說李彥宏在尋找風險投資時,投資人詢問其他三個搜索引擎業(yè)界的技術高人一個問題:要了解搜索引擎技術應該問誰。這三個被問到的高人中有兩個回答:搜索引擎的事就問李彥宏。由此投資人斷定李彥宏是最了解搜索引擎的人之一。
這其實就是現(xiàn)實生活中類似于鏈接關系的應用。要判斷哪個頁面最具權威性,不能光看頁面自己怎么說,還要看其他頁面怎么評價。
李彥宏1997年就提交了一份名為“超鏈文件檢索系統(tǒng)和方法”的專利申請,這比Google創(chuàng)始人發(fā)明PR要早得多,不得不說這是非常具有前瞻性的研究工作。在這份專利中,李彥宏提出了與傳統(tǒng)信息檢索系統(tǒng)不同的基于鏈接的排名方法。
這個系統(tǒng)除了索引頁面之外,還建立一個鏈接詞庫,記錄鏈接錨文字的一些相關信息,如錨文字中包含哪些關鍵詞,發(fā)出鏈接的頁面索引,包含特定錨文字的鏈接總數(shù),包含特定關鍵詞的鏈接都指向哪些頁面。詞庫不僅包含關鍵詞原型,也包含同一個詞干的其他衍生關鍵詞。
根據(jù)這些鏈接數(shù)據(jù),尤其是錨文字,計算出基于鏈接的文件相關性。在用戶搜索時,將得到的基于鏈接的相關性與基于關鍵詞匹配的傳統(tǒng)相關性綜合使用,得到更準確的排名。
在今天看來,這種基于鏈接的相關性計算是搜索引擎的常態(tài),每個SEO人員都知道。但是在十三四年前,這無疑是非常創(chuàng)新的概念。當然現(xiàn)在的搜索引擎算法對鏈接的考慮,已經不僅僅是錨文字,實際上要復雜得多。