—如何玩轉(zhuǎn)搜索
計算機搜索具有其他任何技術(shù)發(fā)明都無法比擬的優(yōu)勢,它使得我們在信息時代的生存發(fā)展成為可能。氧氣所到之處,一切都會隨之改變。與此類似,搜索功能可以實現(xiàn)電腦文件、電子郵件、日歷條目、數(shù)據(jù)庫內(nèi)容和網(wǎng)絡信息的快速檢索,這種能力已經(jīng)改變了我們存儲信息、取回信息及使用信息的方式。換言之,計算機搜索已經(jīng)把我們從本不完美的大腦造成的混亂當中解放出來。
借助搜索功能,你再也不必像過去那樣,費盡心思要把自己的信息資料歸置得井井有條了。這就好比你再也不用一件一件地把所有衣服都掛好一樣。相反,你只要把衣服扔到那個越來越高的大堆上就行。等到你想穿一件9號碼的襯衫時,直接提出要求,那件衣服就像變魔術(shù)一樣,神奇地出現(xiàn)在衣服堆的最頂上。這是多么自由的感覺??!
過去10~15年間,計算機輔助搜索已經(jīng)成為我們生活當中不可分割的一個組成部分。搜索技術(shù)不斷演化,從最初只有研究人員和科學家在他們那些稀奇古怪的計算機上使用的東西,一直演變成我們大多數(shù)人每天都會本能地使用很多次的普通工具。我們呼吸,我們眨眼,我們吃飯,我們睡覺,我們“Google”。
結(jié)果我們大多數(shù)人都沒有對計算機搜索予以太多的關(guān)注。實際上,我們現(xiàn)在已經(jīng)普遍認為搜索是理所當然的事情。不過,搜索實際上是一種技能,它對新式有序組織至關(guān)重要。你在搜索這件事上變得越機智,你在濾除次要信息、抓住關(guān)鍵問題方面做得就越好。具備實施目標明確的快速搜索能力,有助于盡快找到自己需要的信息。有了計算機搜索,你就不必勞神費力地考慮在哪里能找到某條信息,也用不著處心積慮地算計該把這個內(nèi)容放在什么地方。自己想要的資料,只要一搜索,馬上就會出現(xiàn)。
因此,我們努力掌握搜索技能吧。我在這一章中會分享自己進行搜索的一些策略和訣竅,以便讓你的搜索更有效。我以“Google搜索”作為本章的中心議題,因為大多數(shù)人都使用Google搜索。雖然Google搜索有很多競爭對手,但我認為Google搜索憑借簡潔的搜索界面和成熟的關(guān)聯(lián)算法,還是會一如既往地為我們提供最好的搜索引擎服務(我曾經(jīng)供職于Google公司,這一點不會影響上述事實)。
搜索引擎的設置
Google搜索和大多數(shù)搜索引擎使用的是一種稱為“爬蟲”(crawler)的自動軟件代理技術(shù),這種代理也叫“蜘蛛”(spider)或“機器人”(robot)。爬蟲程序會頻繁地訪問網(wǎng)絡站點,讀取并捕獲網(wǎng)頁上的大部分文本信息,同時也會跟蹤進入該網(wǎng)站的其他頁面。
爬蟲程序在一個網(wǎng)站上搜集到的信息會添加到搜索引擎的網(wǎng)頁索引中。當你提請查詢的時候,搜索引擎會快速分析網(wǎng)頁索引中的相關(guān)信息,以便找出匹配內(nèi)容。搜索結(jié)果按照相關(guān)性排序,相關(guān)程度最高的網(wǎng)頁排在最前面。(當然,我說的是搜索的自然結(jié)果,而不是付費搜索結(jié)果。在Google搜索結(jié)果頁面的最上方和該頁的右側(cè),可以看到那些很小的純文本型付費廣告。)
搜索引擎使用很多不同的相關(guān)因子來決定與你的查詢要求相關(guān)性最高的結(jié)果是什么。Google搜索使用的相關(guān)因子有200多個,其中包括你的搜索條件出現(xiàn)在網(wǎng)頁的什么地方,這個條件出現(xiàn)的頻率有多高等因素。譬如,只是在搜索框中輸入videoconferencing(視頻會議)這個詞,Google搜索到的結(jié)果會有數(shù)百萬條。這個時候排在最前面的搜索結(jié)果有維基百科(Wikipedia)的網(wǎng)站和《商業(yè)周刊》(Business Week)的一篇文章。在這兩個搜索結(jié)果中,videoconferencing這個單詞都是出現(xiàn)在網(wǎng)頁的標題中(這正是“查詢條件出現(xiàn)位置”這個因子的影響),而且這個單詞在網(wǎng)站和周刊文章中至少出現(xiàn)了4次(這是“出現(xiàn)頻率”因子在起作用)。