注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書人文社科社會(huì)科學(xué)圖書館學(xué)/情報(bào)學(xué)/檔案學(xué)搜索引擎與信息檢索教程

搜索引擎與信息檢索教程

搜索引擎與信息檢索教程

定 價(jià):¥28.00

作 者: 袁津生 等編著
出版社: 中國水利水電出版社
叢編項(xiàng): 21世紀(jì)高等學(xué)校精品教材
標(biāo) 簽: 檔案學(xué)

ISBN: 9787508453941 出版時(shí)間: 2008-01-01 包裝: 平裝
開本: 16 頁數(shù): 278 字?jǐn)?shù):  

內(nèi)容簡介

  隨著搜索引擎技術(shù)的發(fā)展和不斷完善,越來越多的人開始對(duì)搜索引擎原理和技術(shù)進(jìn)行研究,越來越多的人喜歡上了搜索引擎。 本書從教學(xué)的角度出發(fā),全面闡述了搜索引擎技術(shù)和信息檢索技術(shù),包括:搜索引擎的基本原理與技術(shù)、搜索引擎的數(shù)據(jù)結(jié)構(gòu)和搜索引擎的爬蟲、信息獲取與信息檢索技術(shù)、分類與聚類技術(shù)以及Web信息檢索技術(shù)?!”緯m合高等院校計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)以及相關(guān)專業(yè)的高年級(jí)學(xué)生和研究生閱讀參考,也適合相關(guān)領(lǐng)域的工程技術(shù)人員參閱。

作者簡介

  ?

圖書目錄

前言
第1章 搜索引擎概述
1.1 搜索引擎的概念
1.2 搜索引擎的發(fā)展史
1.3 搜索引擎的分類
1.4 搜索引擎的信息檢索模型
1.5 建立搜索引擎的關(guān)鍵技術(shù)
1.6 中文搜索引擎的發(fā)展趨勢(shì)
1.7 主要搜索引擎介紹
1.7.1 谷歌(Google)搜索
1.7.2 雅虎(Yahoo)搜索
1.7.3 百度(Baidu)搜索
1.7.4 天網(wǎng)搜索
1.8 小結(jié)
思考題
第2章 搜索引擎的工作原理
2.1 搜索引擎的基本結(jié)構(gòu)及工作原理
2.2 網(wǎng)頁的搜集
2.3 網(wǎng)頁內(nèi)容的提取
2.4 查詢服務(wù)
2.5 小結(jié)
思考題
第3章 信息檢索的模型
3.1 經(jīng)典模型
3.1.1 布爾模型
3.1.2 向量模型
3.1.3 概率模型
3.2 代數(shù)模型
3.2.1 廣義向量空間模型
3.2.2 神經(jīng)網(wǎng)絡(luò)模型
3.3 其他概率模型
3.3.1 貝葉斯網(wǎng)絡(luò)
3.3.2 推理網(wǎng)絡(luò)模型
3.3.3 信任度網(wǎng)絡(luò)模型
3.4 小結(jié)
思考題
第4章 文本操作
4.1 文本預(yù)處理
4.1.1 文本的詞法分析
4.1.2 中文分詞技術(shù)
4.1.3 無用詞匯的刪除
4.1.4 詞干提取技術(shù)
4.1.5 索引詞條的選擇
4.1.6 詞典
4.2 文本聚類
4.2.1 文本聚類算法
4.2.2 文本聚類中的相關(guān)概念
4.2.3 特征空間的降維處理
4.3 文本壓縮
4.3.1 基本概念
4.3.2 統(tǒng)計(jì)方法
4.3.3 字典方法
4.3.4 倒排文檔壓縮
4.4 小結(jié)
思考題
第5章 文本信息檢索技術(shù)
5.1 順排文檔檢索
5.1.1 表展開法
5.1.2 邏輯樹展開法
5.1.3 其他順排文檔檢索算法
5.2 倒排文檔檢索
5.2.1 倒排文檔的檢索
5.2.2 倒排文檔的建立
5.2.3 逆波蘭表達(dá)式
5.2.4 檢索指令表的生成
5.2.5 檢索實(shí)施
5.3 布爾檢索
5.4 加權(quán)檢索
5.4.1 檢索詞加權(quán)檢索
5.4.2 詞頻加權(quán)檢索
5.4.3 標(biāo)引加權(quán)檢索
5.5 全文檢索
5.5.1 全文檢索的技術(shù)指標(biāo)
5.5.2 全文檢索的實(shí)現(xiàn)
5.5.3 全文檢索效率的提高
5.6 超文本檢索
5.6.1 超文本技術(shù)概述
5.6.2 超文本的功能及結(jié)構(gòu)
5.6.3 超文本檢索的優(yōu)缺點(diǎn)
5.7 分布式信息檢索
5.7.1 分布式檢索的查詢協(xié)議
5.7.2 分布式檢索系統(tǒng)的結(jié)構(gòu)
5.7.3 分布式信息檢索模式
5.7.4 分布式檢索資源選擇
5.8 分布式數(shù)據(jù)庫查詢技術(shù)
5.8.1 分布式數(shù)據(jù)庫的基本概念
5.8.2 利用C#實(shí)現(xiàn)分布式數(shù)據(jù)庫查詢
5.8.3 基于.NET Remoting的查詢技術(shù)
5.8.4 基于DCOM的分布式查詢技術(shù)
5.8.5 基于JDBC的查詢技術(shù)
5.8.6 基于Servlet的查詢技術(shù)
5.8.7 基于CORBA的查詢技術(shù)
5.8.8 基于Agent的查詢技術(shù)
5.9 小結(jié)
思考題
第6章 信息檢索評(píng)價(jià)
6.1 相關(guān)性
6.1.1 相關(guān)性的特征
6.1.2 相關(guān)性研究類別
6.1.3 相關(guān)性模型
6.2 信息檢索性能評(píng)價(jià)
6.2.1 信息檢索系統(tǒng)的有效性
6.2.2 評(píng)價(jià)指標(biāo)
6.2.3 Web檢索系統(tǒng)性能評(píng)價(jià)
6.3 信息檢索領(lǐng)域的相關(guān)組織和會(huì)議
6.4 小結(jié)
思考題
第7章 文本分類與聚類
7.1 分類與聚類介紹
7.1.1 文本分類
7.1.2 文本聚類
7.1.3 文本分類的算法
7.1.4 文本聚類的算法
7.1.5 自動(dòng)分類與自動(dòng)聚類
7.1.6 文本分類的評(píng)測(cè)方法與指標(biāo)
7.1.7 文本聚類的評(píng)測(cè)方法與指標(biāo)
7.2 常用文本分類方法
7.2.1 文本分類的問題
7.2.2 kNN分類算法
7.2.3 NB分類算法
7.2.4 決策樹分類算法
7.2.5 Rocchio分類算法
7.2.6 支持向量機(jī)分類算法
7.2.7 特征選擇分類算法.
7.2.8 文本分類系統(tǒng)的實(shí)現(xiàn)
7.3 常用文本聚類方法
7.3.1 層次聚類算法
7.3.2 分割聚類算法
7.3.3 基于密度的聚類算法
7.3.4 基于網(wǎng)格的聚類算法
7.3.5 基于模型的聚類算法
7.4 小結(jié)
思考題
第8章 Web信息檢索技術(shù)
8.1 Web信息處理的基本技術(shù)
8.1.1 Web信息的基本特點(diǎn)
8.1.2 Web信息的表現(xiàn)方式
8.1.3 Web信息系統(tǒng)結(jié)構(gòu)
8.1.4 網(wǎng)絡(luò)信息資源的組織與管理
8.2 Web數(shù)據(jù)挖掘
8.2.1 Web挖掘流程
8.2.2 Web挖掘的分類及現(xiàn)狀
8.2.3 Web數(shù)據(jù)挖掘和Web信息檢索的區(qū)別
8.3 Web信息檢索的關(guān)鍵技術(shù)
8.3.1 文檔搜集
8.3.2 文檔預(yù)處理
8.3.3 索引數(shù)據(jù)庫的建立
8.3.4 相似度計(jì)算與排序方法
8.4 搜索引擎的基本結(jié)構(gòu)
8.4.1 搜索引擎的結(jié)構(gòu)分類
8.4.2 網(wǎng)頁收集模塊
8.4.3 網(wǎng)頁索引模塊
8.4.4 查詢模塊
8.4.5 用戶界面
8.4.6 搜索引擎的主要指標(biāo)及分析
8.5 搜索引擎的數(shù)據(jù)結(jié)構(gòu)
8.5.1 存儲(chǔ)結(jié)構(gòu)
8.5.2 信息庫
8.5.3 文本索引
8.5.4 詞典
8.5.5 采樣表
8.5.6 前向索引
8.5.7 后向索引
8.6 搜索引擎爬蟲
8.6.1 網(wǎng)絡(luò)爬蟲
8.6.2 深度優(yōu)先策略
8.6.3 廣度優(yōu)先策略
8.6.4 不重復(fù)抓取策略
8.6.5 網(wǎng)頁抓取優(yōu)先策略
8.6.6 網(wǎng)頁重訪策略
8.6.7 網(wǎng)頁抓取提速策略
8.6.8 Robots協(xié)議
8.6.9 網(wǎng)頁內(nèi)容提取技術(shù)
8.7 元搜索引擎
8.7.1 元搜索引擎的基本構(gòu)成
8.7.2 常用元搜索引擎介紹及其分類
8.7.3 與獨(dú)立搜索引擎的比較
8.7.4 主要技術(shù)指標(biāo)及分析
8.8 小結(jié)
思考題
第9章 搜索引擎開發(fā)技術(shù)
9.1 實(shí)例簡介
9.1.1 搜索引擎的體系結(jié)構(gòu)
9.1.2 網(wǎng)頁搜集
9.1.3 網(wǎng)頁預(yù)處理
9.1.4 查詢服務(wù)
9.2 環(huán)境搭建與配置
9.2.1 idk 1.6的安裝與配置
9.2.2 eclipse的安裝與配置
9.2.3 Tomcat的安裝與配置
9.2.4 Heritrix的安裝與配置
9.3 網(wǎng)頁搜集的實(shí)現(xiàn)
9.3.1 擴(kuò)展Heritrix
9.3.2 抓取網(wǎng)頁
9.4 預(yù)處理的實(shí)現(xiàn)
9.4.1 原始網(wǎng)頁的處理
9.4.2 建立索引——Lucene
9.5 提供查詢服務(wù)
9.5.1 搜索引擎架構(gòu)設(shè)計(jì)
9.5.2 后臺(tái)設(shè)計(jì)和實(shí)現(xiàn)
9.5.3 頁面設(shè)計(jì)和實(shí)現(xiàn)
9.5.4 部署到Tomcat
9.6 小結(jié)
實(shí)驗(yàn)
參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)