出版說明
前言
第1章 移動搜索引擎概述
1.1 引言
1.2 移動搜索引擎的特點
1.3 移動搜索引擎的分類
1.4 移動搜索引擎市場現狀
1.5 移動搜索引擎的關鍵技術簡介
1.6 移動搜索與3G
1.7 小結
第2章 移動通信技術概述
2.1 移動通信的分類
2.2 全球移動通信(GSM)網絡
2.2.1 移動臺(MS)
2.2.2 基站子系統(BSS)
2.2.3 網絡子系統(NSS)
2.2.4 操作支持子系統(OSS)
2.2.5 移動搜索引擎與GSM網絡
2.3 GSM的升級GPRS
2.3.1 GPRS的特點
2.3.2 GPRS的工作原理
2.3.3 GPRS的網絡結構和網元功能
2.3.4 GPRS各個接口協議棧的功能
2.4 CDMA(CodeDivisionMultipleAccess)
2.4.1 CDMA技術的標準化
2.4.2 CDMA的優(yōu)勢
2.5 短信方式下的移動搜索引擎協議
2.5.1 SMS(ShortMessagingService)
2.5.2 EMS(EnhancedMessagingService)
2.5.3 MMS(MultimediaMessageService)
2.5.4 SMS、EMS、MMS三者技術對比
2.6 WAP
2.6.1 WAP的特點
2.6.2 WAP的優(yōu)勢及局限性
2.6.3 WAP的發(fā)展前景
2.7 CMWAP和CMNET
2.7.1 CMWAP與CMNET的區(qū)別
2.7.2 CMWAP與CMNET服務適用范圍
2.8 小結
第3章 網頁抓取技術
3.1 基于WAP的搜索引擎系統結構
3.2 WAP爬蟲基本原理
3.2.1 網頁抓取
3.2.2 內容提取
3.2.3 爬蟲的難題
3.2.4 爬蟲更新周期
3.3 WAP爬蟲的關鍵技術
3.3.1 從種子站點開始逐層抓?。ㄖ饘幼ト〔呗裕?br />3.3.2 不重復抓取策略
3.3.3 網頁抓取優(yōu)先策略
3.3.4 網頁重訪策略
3.3.5 Robots協議
3.3.6 抓取提速策略
3.4 構建垂直搜索引擎
3.4.1 小天音樂垂直搜索引擎整體處理流程
3.4.2 小天音樂垂直搜索引擎服務器部分源代碼
3.5 小結
第4章 網頁信息預處理
4.1 結構化的數據和半結構化的數據
4.1.1 XML——最常見的結構化數據
4.1.2 半結構化的數據
4.2 網頁信息結構化
4.2.1 網頁信息結構化的基本流程
4.2.2 建立DOM樹的原理
4.2.3 移動網頁的信息結構化
4.3 中文分詞
4.3.1 中文分詞的概念
4.3.2 中文分詞的難點
4.3.3 基于字典的分詞方法
4.3.4 用統計學的方法解決新詞識別問題
4.3.5 主流中文搜索引擎分詞效果比較
4.3.6 典型的中文分詞系統
4.4 小結
第5章 建立索引和實現查詢
5.1 搜索引擎中的索引簡介
5.1.1 基于索引的搜索引擎分類
5.1.2 索引器在搜索引擎中的作用
5.2 建立索引
5.2.1 倒排文件索引(InvertedFileIndex)的建立
5.2.2 后綴數組
5.2.3 簽名文件索引(SigamtureFileIndex)
5.3 查詢服務
5.3.1 查詢器的實現原理
5.3.2 查詢器的分頁機制
5.3.3 查詢擴展與結果集的動態(tài)分類
5.4 查詢結果排序
5.4.1 PageRaNk算法
5.4.2 HillT0p算法
5.4.3 提升網頁排序的方法
5.5 索引設計的典型案例
5.6 小結
第6章 WML轉換
6.1 標記語言簡介
6.1.1 HTML
6.1.2 XML
6.1 -3XHTML
6.1.4 WML
6.2 WAJP體系與結構
6.2.1 WAP體系結構
6.2.2 萬維網模型
6.2.3 WAP模型
6.3 HTML到WML的轉換
6.3.1 標記語言轉換概述
6.3.2 HTML與WML的主要語法標記
6.3.3 HTML與WMHL的文檔結構對比
6.3.4 HTML與WML的轉換
6.3.5 正則表達式和Java開源項目
6.4 衡量搜索引擎性能
6.4.1 衡量搜索引擎的性能指標
6.4.2 搜索引擎的評價方式
6.5 小結
第7章 基于短信的移動搜索引擎
7.1 概述
7.2 互聯網和短信并存的效應
7.3 短信平臺
7.4 短信接入
7.4.1 協議規(guī)范
7.4.2 協議流程
7.4.3 接口更改
7.4.4 接口開發(fā)
7.5 短信搜索的功能設計
7.5.1 功能組織結構
7.5.2 短信監(jiān)控功能設計
7.5.3 短信監(jiān)控的數據庫設計
7.5.4 分發(fā)平臺功能設計
7.5.5 處理模塊功能設計
7.6 小結
第8章 并行技術在移動搜索中的應用
8.1 并行計算
8.1.1 并行計算的概念
8.1.2 并行計算的發(fā)展
8.2 MPI簡述
8.2.1 MPI的產生
8.2.2 MPI的語言綁定
8.2.3 目前主要的MPI實現
8.2.4 MPI程序結構
8.3 并行計算技術在移動搜索引擎中的應用
8.4 并行計算技術在索引/排序部分的應用
8.5 并行計算技術在移動搜索部分的應用
……
第9章 3G時代的移動搜索引擎展望
第10章 數據挖掘技術在移動搜索引擎中的應用
參考文獻