注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)信息系統(tǒng)現(xiàn)代信息檢索

現(xiàn)代信息檢索

現(xiàn)代信息檢索

定 價(jià):¥45.00

作 者: Ricardo Baeza-Yates,Berthier Ribeiro-Neto等著;王知津等譯;王知津譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 計(jì)算機(jī)科學(xué)叢書(shū)
標(biāo) 簽: 暫缺

ISBN: 9787111158783 出版時(shí)間: 2005-03-01 包裝: 平裝
開(kāi)本: 26cm 頁(yè)數(shù): 388 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)對(duì)信息檢索領(lǐng)域的最新進(jìn)展作了嚴(yán)謹(jǐn)、完整的剖析,內(nèi)容涉及信息檢索的數(shù)學(xué)模型、評(píng)價(jià)、查詢語(yǔ)言與操作、文本語(yǔ)言與操作、多媒體語(yǔ)言及其特征、標(biāo)引與檢索、并行與分布式檢索、用戶界面與可視化、多媒體信息檢索的模型與語(yǔ)言、多媒體信息檢索的標(biāo)引和檢索、Web檢索、圖書(shū)館與書(shū)目系統(tǒng)和數(shù)字圖書(shū)館等。本書(shū)內(nèi)容廣泛、細(xì)節(jié)豐富、深入淺出,可以作為高等院校信息管理與信息系統(tǒng)、計(jì)算機(jī)科學(xué)與技術(shù)、圖書(shū)館學(xué)、情報(bào)學(xué)、檔案學(xué)等專業(yè)本科生和研究生的教材或參考書(shū),對(duì)從事信息檢索及其系統(tǒng)與網(wǎng)絡(luò)的分析、設(shè)計(jì)的實(shí)際工作者也有較高的參考價(jià)值。本書(shū)前言前言近年來(lái),隨著互聯(lián)網(wǎng)的發(fā)展以及現(xiàn)代的、廉價(jià)的圖形用戶界面和大容量存儲(chǔ)設(shè)備的出現(xiàn),信息檢索(informationretrieval,IR)領(lǐng)域已經(jīng)發(fā)生了巨大的變化,這使得傳統(tǒng)的信息檢索教材變得過(guò)時(shí),所以很有必要引進(jìn)新的信息檢索圖書(shū)。我們堅(jiān)信,讀者非常需要一本從計(jì)算機(jī)科學(xué)的觀點(diǎn)(相對(duì)于用戶中心觀點(diǎn))嚴(yán)謹(jǐn)完整地剖析該領(lǐng)域的書(shū)。本書(shū)正是致力于填補(bǔ)這一空白,并適合作為信息檢索的本科課程和研究生課程的教材。本書(shū)由兩個(gè)既相互補(bǔ)充又相互平衡的部分組成。前九章是核心部分,由本書(shū)的設(shè)計(jì)者編著或合著;第二部分共六章,與第一部分緊密相連,是由本領(lǐng)域的杰出研究者編寫(xiě)的相關(guān)學(xué)科最新成果。所有章節(jié)都使用相同的注釋和術(shù)語(yǔ)。因此,盡管本書(shū)由多人合著,但實(shí)際上是一本很好的教材,而不是將各個(gè)作者所寫(xiě)的章節(jié)簡(jiǎn)單地編輯在一起。此外,我們還精心設(shè)計(jì)了本書(shū)的內(nèi)容和結(jié)構(gòu),力求全面展示現(xiàn)代信息檢索各重要部分的觀點(diǎn)。從信息檢索模型到標(biāo)引文本、從信息檢索可視化工具到Web界面、從信息檢索多媒體到數(shù)字圖書(shū)館,本書(shū)內(nèi)容廣泛、細(xì)節(jié)豐富。鑒于信息檢索對(duì)現(xiàn)代社會(huì)的緊密相關(guān)性和重要性,我們希望本書(shū)為進(jìn)一步在全球范圍內(nèi)傳播信息科學(xué)、計(jì)算機(jī)科學(xué)和圖書(shū)館學(xué)的學(xué)科研究成果做出貢獻(xiàn)。譯者序RicardoBaeza-Yates和BerthierRibeiro-Neto是國(guó)際信息學(xué)界人士非常敬重的信息檢索方面的專家,他們的作品都是口碑極佳的上乘之作,為他們的作品寫(xiě)譯者序,這個(gè)念頭本身就比較僭越。拜讀此書(shū),沉思良久,深感此書(shū)確實(shí)討論了信息檢索中許多非常重要的問(wèn)題,而它們又是非常實(shí)際的,有些也是我們?cè)诠ぷ髦薪?jīng)常遇到的。文中的討論和分析通俗易懂,又寓意深遠(yuǎn),讀后頗感收獲甚豐,不免由此萌生了將這本書(shū)介紹給國(guó)內(nèi)同行的想法。幾經(jīng)輾轉(zhuǎn),了解到機(jī)械工業(yè)出版社有意出版此書(shū),便自告奮勇地承擔(dān)起了翻譯的工作。信息檢索是信息管理領(lǐng)域中的核心部分。面對(duì)人類社會(huì)不斷發(fā)展而積累起來(lái)的海量知識(shí),如何高效、準(zhǔn)確地查找所需要的信息,是每一個(gè)人在學(xué)習(xí)、研究和生活中都無(wú)法回避的問(wèn)題。信息檢索最早起源于圖書(shū)館的參考咨詢工作和書(shū)目工作,后來(lái),隨著信息的急劇增加,人們對(duì)信息的利用也日趨廣泛,信息檢索也逐漸普及開(kāi)來(lái)。計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、通信技術(shù)和大容量存儲(chǔ)技術(shù)的發(fā)展和流行,使得信息檢索領(lǐng)域也發(fā)生了巨大的變化,現(xiàn)代信息檢索與計(jì)算機(jī)科學(xué)的聯(lián)系越來(lái)越密切,信息檢索進(jìn)入了全新的發(fā)展階段。目前,環(huán)顧國(guó)內(nèi)外,關(guān)于信息檢索的教材可謂琳瑯滿目,但大多數(shù)都是由圖書(shū)館學(xué)家、情報(bào)學(xué)家編寫(xiě)的,側(cè)重于信息檢索的基本原理與基本方法,操作性較強(qiáng)。Baeza-Yates和Ribeiro-Neto兩人本身是計(jì)算機(jī)領(lǐng)域的專家,又熟諳信息檢索的理論;他們從計(jì)算機(jī)科學(xué)的觀點(diǎn)出發(fā),將計(jì)算機(jī)理論與信息檢索結(jié)合起來(lái),重點(diǎn)闡述了信息檢索的數(shù)學(xué)模型和實(shí)現(xiàn)技術(shù),不啻為一部開(kāi)歷史之先河的佳作,本書(shū)的價(jià)值也在于此。我們相信,任何從事信息檢索領(lǐng)域工作的人們,任何希望能快速、便捷地檢索信息的人們,都會(huì)從本書(shū)的閱讀中受益匪淺,這也是我們?cè)敢庾鲞@件事的原因所在。受益于此書(shū)有余,不揣冒昧地為本書(shū)的讀者們建議一條高效的閱讀途徑。本書(shū)分為兩大部分,第一部分由第1章至第9章組成,以數(shù)學(xué)理論為基礎(chǔ),深入淺出地分析了信息檢索的模型、評(píng)價(jià)、查詢語(yǔ)言與操作、文本語(yǔ)言與操作、多媒體語(yǔ)言及其特征、標(biāo)引與檢索、并行與分布式檢索等,內(nèi)容嚴(yán)謹(jǐn)而又翔實(shí),這部分構(gòu)成了本書(shū)的核心。相比較而言,第4章“查詢語(yǔ)言”是讀者更合理的起點(diǎn),第2章“建?!笔抢斫馊珪?shū)的關(guān)鍵所在,任何檢索都是在此基礎(chǔ)上推廣而來(lái)的。后一部分由第10章至第15章組成,這是計(jì)算機(jī)科學(xué)應(yīng)用于信息檢索領(lǐng)域的最新成果,主要涉及用戶界面與可視化、多媒體信息檢索的模型與語(yǔ)言及其標(biāo)引與檢索、Web檢索、圖書(shū)館與書(shū)目系統(tǒng)、數(shù)字圖書(shū)館等,這部分是前一部分的合乎邏輯的延伸和擴(kuò)展。從事信息檢索研究的人們可以此為開(kāi)端,了解新形勢(shì)下的信息檢索。此外,每一章都有“發(fā)展趨勢(shì)與研究課題”和“書(shū)目討論”兩節(jié),給讀者提供了廣闊、深入的進(jìn)一步學(xué)習(xí)和研究的空間。本書(shū)的內(nèi)容還有很多,在閱讀的過(guò)程中,你將會(huì)發(fā)現(xiàn)許多新鮮生動(dòng)而又非常深刻的東西,會(huì)發(fā)現(xiàn)許多你本該知道而至今尚未知曉的東西,這也是我們?cè)陂喿x和翻譯這本書(shū)過(guò)程中的切身體會(huì)。一部英文論著在漢語(yǔ)中的旅行,永遠(yuǎn)是無(wú)法捉摸的。對(duì)本書(shū)的譯者來(lái)說(shuō),全書(shū)討論的正是譯者們最為熟知的一個(gè)領(lǐng)域。這次翻譯的前提是對(duì)原文的徹底領(lǐng)會(huì),因此,不會(huì)存在任何技術(shù)細(xì)節(jié)會(huì)因?yàn)樽g者的生疏而發(fā)生扭曲。事實(shí)上,譯者們所面對(duì)的主要是“詞匯”方面。同一個(gè)詞或短語(yǔ),在不同的領(lǐng)域有不同的理解,鑒于此,我們結(jié)合自己多年的信息檢索知識(shí)和經(jīng)驗(yàn),遵從教科書(shū)的習(xí)慣用法,參考了《英漢計(jì)算機(jī)詞典》、《英漢數(shù)學(xué)詞典》等,并請(qǐng)教了一些該領(lǐng)域的專家,力求做到準(zhǔn)確無(wú)誤。依循學(xué)術(shù)慣例,或許不無(wú)感激,我們要感謝對(duì)本書(shū)的翻譯有所襄助的學(xué)人們。本書(shū)由王知津、賈福新、鄭紅軍主譯,李明珍、孫鑫、蔣偉偉、翟婭、劉建準(zhǔn)、王辰君、武麗輝、范志雯、路彩妹、馬愛(ài)萍、譚周明、張國(guó)華、孫美麗、孫立武也對(duì)本書(shū)部分內(nèi)容的初譯作了很多的工作,在此予以衷心感謝。全書(shū)由鄭紅軍進(jìn)行了一校和部分內(nèi)容的重譯,王知津負(fù)責(zé)全書(shū)的二校和最后審定。譯文雖經(jīng)多次修改和校正,并根據(jù)本書(shū)官方網(wǎng)站的最新勘誤表訂正了絕大部分錯(cuò)誤,但由于譯者的水平有限,加之時(shí)間倉(cāng)促,疏漏及缺點(diǎn)、錯(cuò)誤在所難免,我們真誠(chéng)地希望同行和讀者不吝賜教,不勝感激之至。致謝我們向在過(guò)去幾個(gè)月中給予我們無(wú)私幫助的那些人致以誠(chéng)摯的謝意。如果沒(méi)有他們的大力支持,本書(shū)可能無(wú)法得以出版。首先,我們要感謝所有章節(jié)的作者以及他們所做的貢獻(xiàn)。ElisaBertino、EricBrown、BarbaraCatania、ChristosFaloutsos、ElenaFerrari、EdFox、MartiHearst、GonzaloNavarro、EdieRasmussen、OhmSornil、NivioZiviani,他們文章中的專業(yè)知識(shí)是我們所不具備的。在整個(gè)編輯和反復(fù)審核的過(guò)程中,他們表現(xiàn)出了極大的耐心,在此我們表示感謝。其次,我們要感謝對(duì)本書(shū)的出版有著很大興趣的所有人,尤其是ScottDelman和DougSery。再次,我們要感謝AddisonWesleyLongman出版公司在整個(gè)過(guò)程中所做的工作以及KeithMansfield、KarenSutherland、BridgetAllen、DavidHarison、SheilaChatten、HelenHodge和LisaTalbot的興趣和鼓勵(lì)。他們聯(lián)系的評(píng)論人閱讀了本書(shū)的一些早期方案,并給我們提供了好的反饋和非常寶貴的意見(jiàn)?!安⑿泻头植际叫畔z索”一章從“信息檢索應(yīng)用”(在書(shū)中并不適用)部分移至“文本信息檢索”部分,這是因?yàn)橐粋€(gè)不知姓名的推薦人對(duì)此進(jìn)行了客觀的論證。“檢索評(píng)價(jià)”這一章也是另一個(gè)熱情的推薦人強(qiáng)調(diào)了這一主題的重要性后才添加進(jìn)去的。第四,我們要感謝與我們討論這個(gè)方案的所有的人。DougOard對(duì)草案做了初期的評(píng)論。GaryMarchionini是早期的支持者,并與我們保持著緊密的聯(lián)系。BruceCroft從一開(kāi)始就鼓勵(lì)我們盡力地做好。AlbertoMendelzon提出了初始的建議,并在檢索了Web后匯編了各章的參考文獻(xiàn)。EdFox在百忙中抽出時(shí)間對(duì)“緒論”這一章做了非常有見(jiàn)解的評(píng)論(使得這章有很大的改善),并對(duì)“建?!边@一章做了詳盡的評(píng)述。MartiHearst對(duì)我們?cè)缙诘牟莅副憩F(xiàn)出了很大的興趣,并在整個(gè)編輯過(guò)程了給予了幫助,是一位熱情的支持者和參與者。第五,我們要感謝我們單位的支持,智利大學(xué)計(jì)算機(jī)科學(xué)系和FederalUniversityofMinasGerais對(duì)我們無(wú)私的支援。國(guó)家研究局(巴西研究委員會(huì)(CNPq)和智利國(guó)家科學(xué)技術(shù)研究委員會(huì)(CONICYT))、國(guó)際合作項(xiàng)目尤其是西班牙的美洲西班牙語(yǔ)區(qū)發(fā)展科學(xué)技術(shù)部(CYTED)項(xiàng)目ⅤⅡ.13AMYRI(萬(wàn)維網(wǎng)中的信息管理和檢索環(huán)境)、Pronex計(jì)劃下的巴西科技部科研項(xiàng)目信貸局(Finep)項(xiàng)目SIAM(移動(dòng)計(jì)算機(jī)信息系統(tǒng))給我們提供了資金支持。最為重要的是,感謝Helena、Rosa和孩子們,為了本書(shū)我們做了許多旅行調(diào)查、錯(cuò)過(guò)了許多周末而且工作時(shí)間沒(méi)有規(guī)律,而她們默默忍受了這一切。

作者簡(jiǎn)介

  RicardoBaeza-Yates,于加拿大滑鐵盧大學(xué)獲得計(jì)算機(jī)科學(xué)博士學(xué)位。曾擔(dān)任智利計(jì)算機(jī)科學(xué)學(xué)會(huì)主席。1993年,他被授予美國(guó)組織獎(jiǎng),該獎(jiǎng)只頒發(fā)給計(jì)算機(jī)科學(xué)領(lǐng)域的杰出年輕研究人員?,F(xiàn)任智利大學(xué)計(jì)算機(jī)科學(xué)系教授,并在1993-1995年期間擔(dān)任系主任,同時(shí)也是世界上多所大學(xué)的客座教授,在多次國(guó)際會(huì)議上做過(guò)演講,在多個(gè)技術(shù)期刊上發(fā)表過(guò)文章。他還是ACM、EATCS、IEEE、SCCC及SIAM會(huì)員。他的主要研究主謝為算法和數(shù)據(jù)結(jié)構(gòu)、文本檢索、圖形界面以及可視化在數(shù)據(jù)庫(kù)的應(yīng)用。BerthierRibeiro-Neto于加利福尼亞大學(xué)洛杉磯分校獲得計(jì)算機(jī)科學(xué)博士學(xué)位?,F(xiàn)任巴西FederalUniversityofMinasGerais計(jì)算機(jī)科學(xué)系副教授,他是1998年南美“字符串處理和信息檢索”大會(huì)以及1999年“巴西數(shù)據(jù)庫(kù)會(huì)議”的主席,同時(shí)也是ACM、ASIS及IEEE會(huì)員。他的主要研究方向是信息檢索系統(tǒng)、數(shù)字圖書(shū)館、WEB界面及視頻點(diǎn)播。相關(guān)圖書(shū)數(shù)據(jù)倉(cāng)庫(kù)(原書(shū)第3版)神經(jīng)網(wǎng)絡(luò)原理(原書(shū)第2版)編譯原理信息論、編碼與密碼學(xué)軟件需求3D游戲卷1實(shí)時(shí)渲染與軟件技術(shù)3D游戲卷2動(dòng)畫(huà)與高級(jí)實(shí)時(shí)渲染技術(shù)數(shù)字圖像處理疑難解析UNIX系統(tǒng)編程現(xiàn)代操作系統(tǒng)(第2版)計(jì)算機(jī)網(wǎng)絡(luò):自頂向下方法與Internet特色(原書(shū)第3版)高級(jí)編譯器設(shè)計(jì)與實(shí)現(xiàn)計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)方案(原書(shū)第3版)3D計(jì)算機(jī)圖形學(xué)(原書(shū)第3版)C程序設(shè)計(jì)語(yǔ)言(第2版·新版)習(xí)題解答Java面向?qū)ο蟪绦蛟O(shè)計(jì)教程嵌入式微控制器C++編程思想。第2卷:實(shí)用編程技術(shù)模式分析的核方法微機(jī)接口技術(shù)實(shí)驗(yàn)教程C++語(yǔ)言的設(shè)計(jì)和演化并行計(jì)算導(dǎo)論(原書(shū)第2版)離散數(shù)學(xué)導(dǎo)學(xué)數(shù)據(jù)庫(kù)設(shè)計(jì)教程(第2版)組合數(shù)學(xué)(原書(shū)第4版)JAVA編程思想(第2版)數(shù)據(jù)庫(kù)系統(tǒng)導(dǎo)論CAXA數(shù)控銑CAD/CAM技術(shù)C語(yǔ)言的科學(xué)和藝術(shù)計(jì)算機(jī)視覺(jué)信息系統(tǒng)原理:原書(shū)第6版并行程序設(shè)計(jì)數(shù)據(jù)庫(kù)與事務(wù)處理操作系統(tǒng)計(jì)算機(jī)網(wǎng)絡(luò)與因特網(wǎng)(原書(shū)第4版)計(jì)算機(jī)科學(xué)概論(原書(shū)第2版)人工智能:英文可擴(kuò)展并行計(jì)算技術(shù)、結(jié)構(gòu)與編程數(shù)據(jù)庫(kù)原理、編程與性能

圖書(shū)目錄

第1章  緒論        1
1.1  目的        1
1.1.1  信息檢索與數(shù)據(jù)檢索        1
1.1.2  引人注目的信息檢索        2
1.1.3  本書(shū)的重點(diǎn)        2
1.2  基本概念        3
1.2.1  用戶任務(wù)        3
1.2.2  文獻(xiàn)的邏輯視圖        4
1.3  過(guò)去、現(xiàn)在和將來(lái)        4
1.3.1  早期發(fā)展        4
1.3.2  圖書(shū)館的信息檢索        5
1.3.3  Web與數(shù)字圖書(shū)館        5
1.3.4  實(shí)踐問(wèn)題        6
1.4  檢索過(guò)程        6
1.5  本書(shū)的組織        8
1.5.1  本書(shū)的主題        8
1.5.2  本書(shū)的章節(jié)        9
1.6  如何使用本書(shū)        11
1.6.1  教學(xué)建議        11
1.6.2  本書(shū)的網(wǎng)頁(yè)        12
1.7  書(shū)目討論        12
第2章  建模        15
2.1  引言        15
2.2  信息檢索模型的分類        15
2.3  特別檢索和過(guò)濾        17
2.4  信息檢索模型的形式特征        18
2.5  經(jīng)典信息檢索        18
2.5.1  基本概念        18
2.5.2  布爾模型        19
2.5.3  向量模型        20
2.5.4  概率模型        22
2.5.5  經(jīng)典模型的簡(jiǎn)單比較        24
2.6  可供選擇的集合理論模型        25
2.6.1  模糊集合模型        25
2.6.2  擴(kuò)展布爾模型        27
2.7  可供選擇的代數(shù)模型        29
2.7.1  廣義向量空間模型        29
2.7.2  潛語(yǔ)義標(biāo)引模型        31
2.7.3  神經(jīng)網(wǎng)絡(luò)模型        32
2.8  可供選擇的概率模型        34
2.8.1  貝葉斯網(wǎng)絡(luò)        34
2.8.2  推理網(wǎng)絡(luò)模型        35
2.8.3  信任度網(wǎng)絡(luò)模型        39
2.8.4  貝葉斯網(wǎng)絡(luò)模型的比較        41
2.8.5  貝葉斯網(wǎng)絡(luò)的計(jì)算值        42
2.8.6  貝葉斯網(wǎng)絡(luò)模型的影響        42
2.9  結(jié)構(gòu)化文本檢索模型        42
2.9.1  基于非重疊鏈表的模型        43
2.9.2  基于鄰近結(jié)點(diǎn)的模型        44
2.10  瀏覽模型        45
2.10.1  扁平瀏覽模型        45
2.10.2  結(jié)構(gòu)導(dǎo)向模型        45
2.10.3  超文本模型        46
2.11  發(fā)展趨勢(shì)與研究課題        47
2.12  書(shū)目討論        48
第3章  檢索評(píng)價(jià)        51
3.1  引言        51
3.2  檢索性能評(píng)價(jià)        51
3.2.1  查全率和查準(zhǔn)率        52
3.2.2  其他測(cè)度方法        57
3.3  參考文獻(xiàn)集        58
3.3.1  TREC文獻(xiàn)集        58
3.3.2  CACM和ISI測(cè)試集        64
3.3.3  Cystic Fibrosis測(cè)試集        66
3.4  發(fā)展趨勢(shì)與研究課題        67
3.5  書(shū)目討論        67
第4章  查詢語(yǔ)言        69
4.1  引言        69
4.2  基于關(guān)鍵詞的查詢        70
4.2.1  單一詞查詢        70
4.2.2  上下文查詢        70
4.2.3  布爾查詢        71
4.2.4  自然語(yǔ)言        72
4.3  模式匹配        72
4.4  結(jié)構(gòu)性查詢        74
4.4.1  固定式結(jié)構(gòu)        74
4.4.2  超文本        75
4.4.3  層次結(jié)構(gòu)        75
4.5  查詢協(xié)議        78
4.6  發(fā)展趨勢(shì)與研究課題        79
4.7  書(shū)目討論        80
第5章  查詢操作        83
5.1  引言        83
5.2  用戶相關(guān)反饋        83
5.2.1  向量空間模型的查詢擴(kuò)展和語(yǔ)詞重新加權(quán)        84
5.2.2  概率模型的語(yǔ)詞重新加權(quán)        84
5.2.3  概率語(yǔ)詞加權(quán)的一個(gè)變形        86
5.2.4  相關(guān)反饋策略評(píng)價(jià)        86
5.3  自動(dòng)局部分析        87
5.3.1  通過(guò)局部聚類的查詢擴(kuò)展        87
5.3.2  通過(guò)局部上下文分析的查詢擴(kuò)展        91
5.4  自動(dòng)全局分析        92
5.4.1  基于相似性敘詞表的查詢擴(kuò)展        92
5.4.2  基于統(tǒng)計(jì)敘詞表的查詢擴(kuò)展        94
5.5  發(fā)展趨勢(shì)與研究課題        96
5.6  書(shū)目討論        96
第6章  文本與多媒體語(yǔ)言特性        99
6.1  引言        99
6.2  元數(shù)據(jù)        100
6.3  文本        101
6.3.1  格式        101
6.3.2  信息論        101
6.3.3  自然語(yǔ)言建模        102
6.3.4  相似度模型        104
6.4  標(biāo)記語(yǔ)言        104
6.4.1  SGML        105
6.4.2  HTML        106
6.4.3  XML        108
6.5  多媒體        110
6.5.1  格式        110
6.5.2  文本圖像        111
6.5.3  圖形和虛擬現(xiàn)實(shí)        111
6.5.4  超媒體結(jié)構(gòu)化語(yǔ)言HyTime        112
6.6  發(fā)展趨勢(shì)與研究課題        113
6.7  書(shū)目討論        114
第7章  文本操作        115
7.1  引言        115
7.2  文獻(xiàn)預(yù)處理        116
7.2.1  文本的詞匯分析        117
7.2.2  排除停用詞        117
7.2.3  詞干提取        118
7.2.4  標(biāo)引詞的選擇        119
7.2.5  敘詞表        119
7.3  文獻(xiàn)聚類        121
7.4  文本壓縮        122
7.4.1  目的        122
7.4.2  基本概念        123
7.4.3  統(tǒng)計(jì)方法        123
7.4.4  詞典方法        128
7.4.5  倒排文檔壓縮        129
7.5  文本壓縮技術(shù)的比較        130
7.6  發(fā)展趨勢(shì)與研究課題        131
7.7  書(shū)目討論        132
第8章  標(biāo)引與檢索        135
8.1  引言        135
8.2  倒排文檔        136
8.2.1  檢索        138
8.2.2  構(gòu)造        139
8.3  文本的其他索引        141
8.3.1  后綴樹(shù)和后綴數(shù)組        141
8.3.2  簽名檔        146
8.4  布爾查詢        148
8.5  順序檢索        149
8.5.1  布魯特-福斯算法        149
8.5.2  克魯什-莫里斯-普拉特算法        150
8.5.3  博葉-摩爾系列算法        151
8.5.4  移位-或算法        152
8.5.5  后綴自動(dòng)機(jī)算法        153
8.5.6  應(yīng)用比較        153
8.5.7  詞組查詢和相鄰查詢        154
8.6  模式匹配        155
8.6.1  字符串容錯(cuò)匹配        155
8.6.2  正則表達(dá)式和擴(kuò)展模式        157
8.6.3  使用索引的模式匹配        157
8.7  結(jié)構(gòu)性查詢        159
8.8  壓縮        159
8.8.1  順序檢索        160
8.8.2  壓縮后的索引        161
8.9  發(fā)展趨勢(shì)與研究課題        162
8.10  書(shū)目討論        163
第9章  并行與分布式信息檢索        165
9.1  引言        165
9.1.1  并行計(jì)算        165
9.1.2  性能指標(biāo)        166
9.2  并行信息檢索        167
9.2.1  引言        167
9.2.2  MIMD體系結(jié)構(gòu)        167
9.2.3  SIMD體系結(jié)構(gòu)        172
9.3  分布式信息檢索        179
9.3.1  引言        179
9.3.2  文獻(xiàn)集分割        180
9.3.3  信息源的選取        181
9.3.4  查詢處理        182
9.3.5  Web應(yīng)用        182
9.4  發(fā)展趨勢(shì)與研究課題        183
9.5  書(shū)目討論        184
第10章  用戶界面與可視化        185
10.1  引言        185
10.2  人機(jī)交互        185
10.2.1  設(shè)計(jì)原則        186
10.2.2  可視化的作用        186
10.2.3  交互系統(tǒng)評(píng)價(jià)        188
10.3  信息存取過(guò)程        188
10.3.1  交互模型        189
10.3.2  信息存取過(guò)程的非檢索部分        190
10.3.3  早期的界面研究        191
10.4  檢索起點(diǎn)        191
10.4.1  信息集合列表        192
10.4.2  概述        192
10.4.3  實(shí)例、對(duì)話、向?qū)?nbsp;       198
10.4.4  信息源的自動(dòng)選擇        199
10.5  查詢的詳細(xì)描述        200
10.5.1  布爾查詢        200
10.5.2  從命令行到表格和菜單        201
10.5.3  分面查詢        202
10.5.4  查詢?cè)敿?xì)描述的圖形方式        203
10.5.5  詞組和相鄰        206
10.5.6  自然語(yǔ)言和自由文本查詢        207
10.6  上下文        208
10.6.1  文獻(xiàn)替代        208
10.6.2  文獻(xiàn)內(nèi)容中的查詢?cè)~命中        209
10.6.3  文獻(xiàn)之間的查詢?cè)~命中        211
10.6.4  SuperBook:上下文與目次表        213
10.6.5  結(jié)果集合上下文的類目        214
10.6.6  運(yùn)用超鏈接組織檢索結(jié)果        215
10.6.7  表格        218
10.7  運(yùn)用相關(guān)性評(píng)價(jià)        219
10.7.1  標(biāo)準(zhǔn)的相關(guān)反饋界面        220
10.7.2  用戶與相關(guān)反饋系統(tǒng)交互研究        221
10.7.3  特定背景下相關(guān)信息的獲取        222
10.7.4  組相關(guān)評(píng)價(jià)        223
10.7.5  偽相關(guān)反饋        223
10.8  界面對(duì)檢索過(guò)程的支持        223
10.8.1  字符串匹配界面        223
10.8.2  窗口管理        225
10.8.3  系統(tǒng)舉例        226
10.8.4  重疊式窗口使用不當(dāng)舉例        229
10.8.5  保留檢索歷史        229
10.8.6  瀏覽、選擇與查詢的集成        230
10.9  發(fā)展趨勢(shì)與研究課題        233
10.10  書(shū)目討論        233
第11章  多媒體信息檢索:模型與語(yǔ)言        235
11.1  引言        235
11.2  數(shù)據(jù)建模        236
11.2.1  商業(yè)數(shù)據(jù)庫(kù)管理系統(tǒng)中多媒體數(shù)據(jù)的支持        238
11.2.2  MULTOS數(shù)據(jù)模型        239
11.3  查詢語(yǔ)言        241
11.3.1  需求描述        241
11.3.2  多媒體數(shù)據(jù)的條件        242
11.3.3  查詢表達(dá)中的不確定性、相鄰性和權(quán)值        243
11.3.4  建議        243
11.4  發(fā)展趨勢(shì)與研究課題        246
11.5  書(shū)目討論        247
第12章  多媒體信息檢索:標(biāo)引與檢索        249
12.1  引言        249
12.2  背景知識(shí)—空間存取方法        250
12.3  通用的多媒體標(biāo)引方法        251
12.4  一維時(shí)間序列        254
12.4.1  距離函數(shù)        254
12.4.2  特征提取和下界        255
12.4.3  實(shí)驗(yàn)        256
12.5  二維彩色圖像        257
12.5.1  圖像特征和距離函數(shù)        258
12.5.2  確定下界        258
12.5.3  實(shí)驗(yàn)        259
12.6  自動(dòng)特征提取        260
12.7  發(fā)展趨勢(shì)與研究課題        260
12.8  書(shū)目討論        262
第13章  Web信息檢索        265
13.1  引言        265
13.2  挑戰(zhàn)        265
13.3  Web特征描述        266
13.3.1  Web測(cè)度        266
13.3.2  Web建模        268
13.4  搜索引擎        269
13.4.1  集中式結(jié)構(gòu)        269
13.4.2  分布式結(jié)構(gòu)        271
13.4.3  用戶界面        272
13.4.4  排序        275
13.4.5  漫游Web        276
13.4.6  索引        277
13.5  瀏覽        278
13.5.1  Web目錄        278
13.5.2  檢索和瀏覽的結(jié)合        279
13.5.3  幫助工具        279
13.6  元搜索引擎        280
13.7  大海撈針        281
13.7.1  用戶問(wèn)題        281
13.7.2  實(shí)例        282
13.7.3  用戶培訓(xùn)        282
13.8  使用超鏈接搜索        283
13.8.1  Web查詢語(yǔ)言        283
13.8.2  動(dòng)態(tài)搜索和軟件代理        283
13.9  發(fā)展趨勢(shì)與研究課題        284
13.10  書(shū)目討論        285
第14章  圖書(shū)館與書(shū)目系統(tǒng)        287
14.1  引言        287
14.2  聯(lián)機(jī)信息檢索系統(tǒng)和文獻(xiàn)數(shù)據(jù)庫(kù)        287
14.2.1  數(shù)據(jù)庫(kù)        288
14.2.2  聯(lián)機(jī)檢索系統(tǒng)        291
14.2.3  聯(lián)機(jī)檢索系統(tǒng)中的信息檢索        292
14.2.4  “自然語(yǔ)言”檢索        293
14.3  聯(lián)機(jī)公共檢索目錄(OPAC)        294
14.3.1  OPAC及其內(nèi)容        295
14.3.2  OPAC和最終用戶        296
14.3.3  OPAC:供應(yīng)商和產(chǎn)品        296
14.3.4  其他OPAC供應(yīng)商        296
14.4  圖書(shū)館和數(shù)字圖書(shū)館項(xiàng)目        297
14.5  發(fā)展趨勢(shì)與研究課題        297
14.6  書(shū)目討論        298
第15章  數(shù)字圖書(shū)館        299
15.1  引言        299
15.2  定義        300
15.3  體系結(jié)構(gòu)        301
15.4  文獻(xiàn)模型、表達(dá)與存取        303
15.4.1  多語(yǔ)種文獻(xiàn)        303
15.4.2  多媒體文獻(xiàn)        303
15.4.3  結(jié)構(gòu)化文獻(xiàn)        304
15.4.4  分布式文獻(xiàn)集        304
15.4.5  聯(lián)邦式檢索        305
15.4.6  存取        306
15.5  原型、項(xiàng)目與接口        306
15.5.1  國(guó)際努力        308
15.5.2  可用性        308
15.6  標(biāo)準(zhǔn)        309
15.6.1  協(xié)議和聯(lián)合        309
15.6.2  元數(shù)據(jù)        310
15.7  發(fā)展趨勢(shì)與研究課題        311
15.8  書(shū)目討論        311
附錄  Porter算法        313
術(shù)語(yǔ)表        317
參考文獻(xiàn)        325
縮略語(yǔ)表        371
索引        375

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)