注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)行業(yè)軟件及應(yīng)用Splunk大數(shù)據(jù)分析

Splunk大數(shù)據(jù)分析

Splunk大數(shù)據(jù)分析

定 價(jià):¥69.00

作 者: (美)Peter Zadrozny ,Raghu Kodali 著
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 計(jì)算機(jī)與互聯(lián)網(wǎng) 數(shù)據(jù)庫

ISBN: 9787111464297 出版時(shí)間: 2014-05-01 包裝: 平裝
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  絕大多數(shù)物理現(xiàn)象、人類活動(dòng)都會(huì)記錄在各種媒介中,而隨著數(shù)字化的普及,這一切又都將轉(zhuǎn)化為數(shù)據(jù),人類正在從“卷宗”社會(huì)走向“數(shù)字”社會(huì)。尤其是近年來伴隨著智能終端、移動(dòng)互聯(lián)網(wǎng)以及物聯(lián)網(wǎng)等信息技術(shù)的發(fā)展,數(shù)字社會(huì)中的數(shù)據(jù)無論是在類型還是規(guī)模方面都在飛速發(fā)展,大數(shù)據(jù)以一種迅疾的速度滲透到我們生活、工作的各個(gè)領(lǐng)域。據(jù)統(tǒng)計(jì),目前全球被創(chuàng)建和復(fù)制的數(shù)據(jù)總量已超過2ZB(1021B),遠(yuǎn)遠(yuǎn)超過人類有史以來所有印刷材料的數(shù)據(jù)總量(約200PB)。想要從龐大的數(shù)據(jù)庫中提取有用的信息或知識(shí),就離不開大數(shù)據(jù)分析技術(shù)和工具。有觀點(diǎn)認(rèn)為,對(duì)于已經(jīng)顛覆或?qū)⒁嵏矀鹘y(tǒng)行業(yè)的應(yīng)用(如電子商務(wù)、互聯(lián)網(wǎng)金融、物聯(lián)網(wǎng)),其核心競爭力之一就是大規(guī)模的數(shù)據(jù)分析能力,也就是我們說的大數(shù)據(jù)能力。相比傳統(tǒng)數(shù)據(jù),大數(shù)據(jù)具有規(guī)模大、類型廣、時(shí)效高等特點(diǎn),存儲(chǔ)和處理這些數(shù)據(jù)必須引入新的技術(shù)和機(jī)制。Splunk是一種典型的大數(shù)據(jù)處理工具,能夠非常高效地按時(shí)序?qū)?shù)據(jù)進(jìn)行存儲(chǔ)、索引、訪問,已廣泛應(yīng)用在多個(gè)領(lǐng)域。為此,本書全面系統(tǒng)地介紹了大數(shù)據(jù)挖掘工具Splunk,從數(shù)據(jù)導(dǎo)入、訪問、挖掘等角度系統(tǒng)介紹Splunk的原理和使用方式,以幫助讀者快速掌握Splunk。在過去幾個(gè)月中,黃琰、凡蕙銘、韓超、賴旦冉、何君、藍(lán)賢赟參與了部分翻譯,傅桔選、沈書毅、葉瑋成擔(dān)任了部分校審工作,在此感謝他們認(rèn)真的態(tài)度和極大的耐心。當(dāng)然,本書的翻譯工作得以順利完成,還要感謝機(jī)械工業(yè)出版社的編輯以及其他所有工作人員在各方面的支持和幫助。最后,對(duì)給予我們無私幫助的那些人致以誠摯的謝意。譯者水平有限,書中疏漏在所難免,敬請(qǐng)讀者批評(píng)指正。

作者簡介

  作者:(美國)扎德羅津尼(Peter Zadrozny) (美國)Raghu Kodali 譯者:唐宏 陳健 Peter Zadrozny,資深軟件技術(shù)專家,OpalliosS公司創(chuàng)始人兼首席技術(shù)官,專注于利用大數(shù)據(jù)和云技術(shù)為客戶提供有價(jià)值產(chǎn)品。Peter還是圣荷西州立大學(xué)大數(shù)據(jù)相關(guān)課程的講師。他曾先后在多家大中型公司擔(dān)任行政和技術(shù)職務(wù),并主導(dǎo)在歐洲開啟webLogic和在墨西哥啟動(dòng)sun微操作系統(tǒng)。他在J2EE和性能工程領(lǐng)域有多部非常成功的著作,并且是流行開源項(xiàng)目Grinder的最初貢獻(xiàn)者。

圖書目錄

譯者序
致謝
第1章 大數(shù)據(jù)和Splunk / 1
1.1 什么是大數(shù)據(jù) / 1
1.2 非傳統(tǒng)的數(shù)據(jù)處理技術(shù) / 5
1.3 Splunk是什么 / 6
1.4 關(guān)于本書 / 7
第2章 將數(shù)據(jù)導(dǎo)入Splunk / 9
2.1 數(shù)據(jù)的多樣性 / 9
2.2 Splunk如何處理多樣化的數(shù)據(jù) / 10
2.2.1 文件和目錄 / 11
2.2.2 數(shù)據(jù)生成器 / 16
2.2.3 生成樣本數(shù)據(jù) / 17
2.2.4 網(wǎng)絡(luò)資源 / 21
2.2.5 Windows數(shù)據(jù) / 21
2.2.6 其他資源 / 21
2.3 應(yīng)用程序和附加組件 / 21
2.4 轉(zhuǎn)發(fā)器 / 26
2.5 小結(jié) / 27
第3章 處理和分析數(shù)據(jù) / 28
3.1 了解組合訪問日志數(shù)據(jù) / 28
3.2 搜索和分析索引數(shù)據(jù) / 29
3.3 報(bào)表 / 35
3.3.1 使用最多的瀏覽器 / 35
3.3.2 排名前五的IP地址 / 37
3.3.3 瀏覽量來源最多的網(wǎng)站 / 38
3.3.4 有多少404事件 / 40
3.3.5 有多少事件包含購買行為 / 42
3.3.6 列出購買的商品 / 42
3.4 排序 / 44
3.5 過濾 / 45
3.6 添加和評(píng)估字段 / 47
3.7 聚合 / 48
3.8 小結(jié) / 54
第4章 結(jié)果的可視化 / 55
4.1 數(shù)據(jù)可視化 / 55
4.2 Splunk是怎樣處理可視化的 / 55
4.3 chart / 60
4.3.1 制作每一個(gè)主機(jī)的GET和POST事件數(shù)量的圖表 / 61
4.3.2 制作每一個(gè)產(chǎn)品類別的購買數(shù)和瀏覽數(shù)的圖表 / 62
4.3.3 哪個(gè)產(chǎn)品種類受HTTP 404錯(cuò)誤的影響 / 63
4.3.4 MyGizmoStore.com的購買趨勢 / 64
4.3.5 事務(wù)持續(xù)時(shí)間 / 66
4.4 timechart / 67
4.4.1 最高購買數(shù)量的產(chǎn)品 / 67
4.4.2 頁面瀏覽率和購買量 / 68
4.5 使用Google Maps應(yīng)用程序來可視化 / 69
4.6 Globe / 71
4.7 儀表盤 / 72
4.8 小結(jié) / 80
第5章 定義警報(bào) / 81
5.1 什么是警報(bào) / 81
5.2 Splunk如何提供警報(bào) / 81
5.2.1 基于商品銷售量的警報(bào) / 82
5.2.2 登錄失敗的警報(bào) / 84
5.2.3 日志文件中關(guān)鍵性錯(cuò)誤的警報(bào) / 87
5.3 小結(jié) / 88
第6章 網(wǎng)站監(jiān)測 / 90
6.1 監(jiān)測網(wǎng)站 / 90
6.2 IT運(yùn)作 / 91
6.2.1 主機(jī)訪問量 / 91
6.2.2 無內(nèi)部訪問的主機(jī)訪問量 / 91
6.2.3 HTTP請(qǐng)求成功的流量 / 93
6.2.4 HTTP請(qǐng)求未成功的流量 / 93
6.2.5 返回HTTP錯(cuò)誤狀態(tài)碼最多的頁面 / 94
6.3 業(yè)務(wù) / 96
6.3.1 區(qū)域用戶統(tǒng)計(jì) / 96
6.3.2 跳出率 / 97
6.3.3 獨(dú)立訪問者數(shù)量 / 98
6.4 小結(jié) / 103
第7章 使用日志文件創(chuàng)建高級(jí)分析 / 104
7.1 傳統(tǒng)的分析方法 / 104
7.2 范式變更 / 105
7.3 語義日志 / 106
7.4 日志最佳實(shí)踐 / 113
7.5 小結(jié) / 115
第8章 航班準(zhǔn)點(diǎn)率項(xiàng)目 / 116
小結(jié) / 118
第9章 將航班數(shù)據(jù)導(dǎo)入Splunk / 119
9.1 處理CSV文件 / 119
9.1.1 航班數(shù)據(jù) / 119
9.1.2 下載數(shù)據(jù) / 120
9.1.3 了解航班數(shù)據(jù) / 121
9.1.4 關(guān)于時(shí)間戳 / 123
9.1.5 將字段映射成一個(gè)時(shí)間戳 / 124
9.1.6 對(duì)所有航班數(shù)據(jù)建立索引 / 131
9.2 從關(guān)系數(shù)據(jù)庫中索引數(shù)據(jù) / 132
9.2.1 定義一個(gè)新的數(shù)據(jù)庫連接 / 132
9.2.2 數(shù)據(jù)庫監(jiān)測 / 133
9.3 小結(jié) / 136
第10章 分析航空公司、機(jī)場、航班和延遲 / 137
10.1 分析航空公司 / 137
10.1.1 計(jì)算航空公司的總數(shù) / 138
10.1.2 可視化結(jié)果 / 139
10.2 分析機(jī)場 / 143
10.3 分析航班 / 146
10.4 分析延遲 / 151
10.4.1 各航空公司航班延遲情況 / 151
10.4.2 各機(jī)場航班延遲的原因 / 152
10.4.3 冬天與夏天的航班延遲情況 / 155
10.5 創(chuàng)建和使用宏命令 / 157
10.6 報(bào)告加速 / 158
10.7 加速統(tǒng)計(jì) / 161
10.8 小結(jié) / 166
第11章 分析一個(gè)特定航班的歷年數(shù)據(jù) / 167
11.1 航空公司名稱 / 167
11.1.1 字段查找自動(dòng)化 / 172
11.1.2 從搜索中創(chuàng)建查找表 / 173
11.2 United flight 871航班 / 174
11.3 小結(jié) / 178
第12章 分析推文 / 179
12.1 開發(fā)樣本流 / 180
12.2 將推文加載到Splunk中 / 183
12.3 Twitter / 185
12.4 最流行的單詞 / 188
12.5 實(shí)時(shí)的Twitter趨勢 / 191
12.6 小結(jié) / 196
第13章 分析Foursquare簽到信息 / 197
13.1 簽到信息格式 / 198
13.2 時(shí)區(qū)注意事項(xiàng) / 202
13.3 裝載簽到數(shù)據(jù) / 203
13.4 分析簽到信息 / 205
13.4.1 星期日早午餐搜索 / 205
13.4.2 Google地圖和熱門地點(diǎn) / 209
13.4.3 地點(diǎn)的簽到模式 / 211
13.4.4 地點(diǎn)的簽到數(shù)量 / 212
13.4.5 分析性別活動(dòng) / 214
13.5 小結(jié) / 217
第14章 情感分析 / 218
14.1 意見、觀點(diǎn)、信仰、信念 / 218
14.2 商業(yè)用途 / 219
14.3 情感分析的技術(shù)性工作 / 220
14.4 情感分析應(yīng)用程序 / 222
14.4.1 全局性的命令 / 223
14.4.2 挖掘情感 / 224
14.4.3 語言的處理 / 226
14.4.4 訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù) / 227
14.5 世界情緒指數(shù)項(xiàng)目 / 231
14.5.1 收集RSS摘要 / 232
14.5.2 將新聞標(biāo)題索引到Splunk中 / 234
14.5.3 定義情感語料庫 / 237
14.5.4 對(duì)結(jié)果進(jìn)行可視化 / 240
14.6 小結(jié) / 242
第15章 遠(yuǎn)程數(shù)據(jù)收集 / 243
15.1 轉(zhuǎn)發(fā)器 / 243
15.1.1 流行的拓?fù)浣Y(jié)構(gòu) / 244
15.1.2 安裝轉(zhuǎn)發(fā)器 / 246
15.2 部署服務(wù)器 / 248
15.2.1 配置部署服務(wù)器 / 250
15.2.2 配置轉(zhuǎn)發(fā)器 / 251
15.3 部署監(jiān)控 / 252
15.4 小結(jié) / 253
第16章 可擴(kuò)展性和高可用性 / 254
16.1 擴(kuò)展Splunk / 254
16.2 聚類 / 259
16.3 小結(jié) / 264
附錄A Splunk的性能 / 265
附錄B 有用的Splunk應(yīng)用程序 / 281"

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)