注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Elasticsearch大數(shù)據(jù)搜索引擎

Elasticsearch大數(shù)據(jù)搜索引擎

Elasticsearch大數(shù)據(jù)搜索引擎

定 價(jià):¥49.00

作 者: 羅剛 著
出版社: 電子工業(yè)出版社
叢編項(xiàng): 人工智能系列
標(biāo) 簽: 計(jì)算機(jī)/網(wǎng)絡(luò) 數(shù)據(jù)庫 數(shù)據(jù)庫理論

ISBN: 9787121332333 出版時(shí)間: 2018-01-01 包裝: 平裝
開本: 16開 頁數(shù): 228 字?jǐn)?shù):  

內(nèi)容簡介

  Elasticsearch搜索集群系統(tǒng)在生產(chǎn)和生活中發(fā)揮著越來越重要的作用。本書介紹了Elasticsearch的使用、原理、系統(tǒng)優(yōu)化與擴(kuò)展應(yīng)用。本書用例子說明了Java、Python、Scala和PHP的編程API,其中在Java搜索界面實(shí)現(xiàn)上,介紹了使用Spring實(shí)現(xiàn)微服務(wù)開發(fā)。為了擴(kuò)展Elasticsearch的功能,本書以中文分詞和英文文本分析為例介紹了插件開發(fā)方法。本書介紹了使用Elasticsearch作為數(shù)據(jù)管理平臺(tái)的日志監(jiān)控與分析方法,介紹了使用OCR從圖像中提取文本以及問答式搜索的開發(fā)方法。

作者簡介

  獵兔搜索技術(shù)創(chuàng)始人曾經(jīng)擔(dān)任國防大學(xué)科研處 技術(shù)顧問工信部 輿情開發(fā)顧問東南大學(xué) 社會(huì)導(dǎo)師首都師范大學(xué) 金融課程講師北京石油化工學(xué)院 社會(huì)導(dǎo)師北大光華管理學(xué)院 技術(shù)顧問藍(lán)汛公司搜索集群技術(shù)咨詢顧問新東方 創(chuàng)新研究院 研究員

圖書目錄

第1章 使用Elasticsearch\t1
1.1 基本概念\t1
1.2 安裝\t2
1.3 搜索集群\t5
1.4 創(chuàng)建索引\t6
1.5 使用Java客戶端接口\t9
1.5.1 創(chuàng)建索引\t11
1.5.2 增加、刪除與修改數(shù)據(jù)\t14
1.5.3 分析器\t16
1.5.4 數(shù)據(jù)導(dǎo)入\t17
1.5.5 通過攝取快速導(dǎo)入數(shù)據(jù)\t17
1.5.6 索引庫結(jié)構(gòu)\t17
1.5.7 查詢\t18
1.5.8 區(qū)間查詢\t22
1.5.9 排序\t23
1.5.10 分布式搜索\t23
1.5.11 過濾器\t24
1.5.12 高亮顯示\t24
1.5.13 分頁\t25
1.5.14 通過聚合實(shí)現(xiàn)分組查詢\t26
1.5.15 文本列的聚合\t27
1.5.16 遍歷數(shù)據(jù)\t28
1.5.17 索引文檔\t29
1.5.18 Percolate\t29
1.6 RESTClient\t30
1.6.1 使用攝取\t31
1.6.2 代碼實(shí)現(xiàn)攝取\t33
1.7 使用Jest\t33
1.8 Python客戶端\t37
1.9 Scala客戶端\t40
1.10 PHP客戶端\t43
1.11 SQL支持\t44
1.12 本章小結(jié)\t48
第2章 開發(fā)插件\t49
2.1 搜索中文\t49
2.1.1 中文分詞原理\t49
2.1.2 中文分詞插件原理\t51
2.1.3 開發(fā)中文分詞插件\t53
2.1.4 中文AnalyzerProvider\t55
2.1.5 字詞混合索引\t57
2.2 搜索英文\t60
2.2.1 句子切分\t60
2.2.2 標(biāo)注詞性\t62
2.3 使用測試套件\t64
2.4 本章小結(jié)\t68
第3章 管理搜索集群\t69
3.1 節(jié)點(diǎn)類型\t69
3.2 管理集群\t69
3.3 寫入權(quán)限控制\t70
3.4 使用X-Pack\t71
3.5 快照\t72
3.6 Zen發(fā)現(xiàn)機(jī)制\t73
3.7 聯(lián)合搜索\t74
3.8 緩存\t74
3.9 本章小結(jié)\t75
第4章 源碼分析\t76
4.1 Lucene源碼分析\t76
4.1.1 Ivy管理依賴項(xiàng)\t76
4.1.2 源碼結(jié)構(gòu)介紹\t76
4.2 Gradle\t77
4.3 Guice\t77
4.4 Joda-Time\t79
4.5 Transport\t80
4.6 線程池\t80
4.7 模塊\t80
4.8 Netty\t81
4.9 分布式\t81
4.10 本章小結(jié)\t82
第5章 搜索相關(guān)性\t83
5.1 BM25檢索模型\t83
5.1.1 使用BM25檢索模型\t86
5.1.2 參數(shù)調(diào)優(yōu)\t86
5.2 學(xué)習(xí)評(píng)分\t86
5.2.1 基本原理\t87
5.2.2 準(zhǔn)備數(shù)據(jù)\t87
5.2.3 Elasticsearch學(xué)習(xí)排名\t89
5.3 本章小結(jié)\t91
第6章 搜索引擎用戶界面\t92
6.1 JSP實(shí)現(xiàn)搜索界面\t92
6.1.1 用于顯示搜索結(jié)果的自定義標(biāo)簽\t93
6.1.2 使用Listlib\t98
6.1.3 實(shí)現(xiàn)翻頁\t100
6.2 使用Spring實(shí)現(xiàn)的搜索界面\t102
6.2.1 實(shí)現(xiàn)REST搜索界面\t102
6.2.2 REST API中的HTTP PUT\t104
6.2.3 Spring-data-elasticsearch\t106
6.2.4 Spring HATEOAS\t112
6.3 實(shí)現(xiàn)搜索接口\t113
6.3.1 編碼識(shí)別\t113
6.3.2 布爾搜索\t116
6.3.3 搜索結(jié)果排序\t116
6.4 實(shí)現(xiàn)相似文檔搜索\t117
6.5 實(shí)現(xiàn)AJAX搜索聯(lián)想詞\t119
6.5.1 估計(jì)查詢?cè)~的文檔頻率\t119
6.5.2 搜索聯(lián)想詞總體結(jié)構(gòu)\t119
6.5.3 服務(wù)器端處理\t120
6.5.4 瀏覽器端處理\t125
6.5.5 拼音提示\t127
6.5.6 部署總結(jié)\t127
6.5.7 Suggester\t128
6.6 推薦搜索詞\t129
6.6.1 挖掘相關(guān)搜索詞\t130
6.6.2 使用多線程計(jì)算相關(guān)搜索詞\t132
6.7 查詢意圖理解\t133
6.7.1 拼音搜索\t133
6.7.2 無結(jié)果處理\t133
6.8 集成其他功能\t134
6.8.1 拼寫檢查\t134
6.8.2 分類統(tǒng)計(jì)\t135
6.8.3 相關(guān)搜索\t141
6.8.4 再次查找\t144
6.8.5 搜索日志\t144
6.9 查詢分析\t146
6.9.1 歷史搜索詞記錄\t146
6.9.2 日志信息過濾\t147
6.9.3 信息統(tǒng)計(jì)\t148
6.9.4 挖掘日志信息\t150
6.9.5 查詢?cè)~意圖分析\t150
6.10 部署網(wǎng)站\t150
6.10.1 部署到Web服務(wù)器\t151
6.10.2 防止攻擊\t152
6.11 本章小結(jié)\t156
第7章 OCR文字識(shí)別\t157
7.1 Tesseract\t157
7.2 使用TensorFlow識(shí)別文字\t161
7.3 OpenCV\t164
7.3.1 預(yù)處理\t166
7.3.2 文字區(qū)域提取\t169
7.3.3 糾正偏斜\t171
7.3.4 Linux環(huán)境支持\t172
7.4 JavaCV\t172
7.5 本章小結(jié)\t174
第8章 問答式搜索\t176
8.1 生成表示語義的代碼\t176
8.2 信息整合\t181
8.2.1 實(shí)體對(duì)齊\t181
8.2.2 編輯距離\t181
8.2.3 Jaro-Winkler距離\t187
8.2.4 比較器\t189
8.2.5 Cleaner\t189
8.2.6 運(yùn)行過程\t190
8.2.7 遺傳算法調(diào)整參數(shù)\t192
8.3 自動(dòng)問答\t193
8.3.1 問句處理器\t193
8.3.2 自動(dòng)發(fā)現(xiàn)答案\t198
8.4 本章小結(jié)\t199
第9章 Elastic系統(tǒng)監(jiān)控\t201
9.1 Logstash\t201
9.1.1 使用Logstash\t201
9.1.2 插件\t203
9.1.3 數(shù)據(jù)庫輸入插件\t206
9.2 Filebeat\t207
9.3 消息過期\t208
9.4 Kibana\t208
9.5 Flume\t209
9.6 Kafka\t210
9.7 Graylog\t211
9.8 物聯(lián)網(wǎng)數(shù)據(jù)\t215
9.9 本章小結(jié)\t216

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)