注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)分布式數(shù)據(jù)庫(kù)HBase案例教程

分布式數(shù)據(jù)庫(kù)HBase案例教程

分布式數(shù)據(jù)庫(kù)HBase案例教程

定 價(jià):¥49.00

作 者: 陳建平 陳岸青 李金湖
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787302602149 出版時(shí)間: 2022-04-01 包裝: 平裝-膠訂
開本: 16開 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書定位是HBase從入門到應(yīng)用的簡(jiǎn)明教程,特色是以實(shí)戰(zhàn)案例為主,內(nèi)容系統(tǒng)全面,講解深入淺出,操作步驟清晰明了。本書配套示例源碼、PPT課件、開發(fā)環(huán)境、教學(xué)視頻、習(xí)題及答案以及其他豐富的教學(xué) 資源。 本書共分為8章,內(nèi)容包括NoSQL數(shù)據(jù)庫(kù)、HBase體系架構(gòu)、HBase的接口、MapReduce與HBase、HBase表設(shè)計(jì)、HBase和Hive、HBase深入剖析、論壇日志分析實(shí)戰(zhàn)。 本書既適合HBase初學(xué)者、大數(shù)據(jù)分析與挖掘初學(xué)者閱讀,也適合作為高等院校和培訓(xùn)機(jī)構(gòu)人工智能、大數(shù)據(jù)等相關(guān)專業(yè)師生的教學(xué)參考書。

作者簡(jiǎn)介

  陳建平,福州德明科技有限公司,大數(shù)據(jù)專家講師。2006年從事大數(shù)據(jù)相關(guān)的工作,2010年開始從事大數(shù)據(jù)培訓(xùn)工作。15人以上的大數(shù)據(jù)團(tuán)隊(duì)帶隊(duì)經(jīng)驗(yàn)。曾承擔(dān)過(guò)BI工程師、數(shù)據(jù)挖掘工程師、大數(shù)據(jù)架構(gòu)師、數(shù)據(jù)科學(xué)家、大數(shù)據(jù)技術(shù)總監(jiān)、合伙人等職位。曾參與和組織過(guò)個(gè)性化推薦大數(shù)據(jù)和圖像處理的人工智能等20多個(gè)項(xiàng)目。曾在上海IBM公司擔(dān)任過(guò)高級(jí)數(shù)據(jù)挖掘工程師。多次受邀參加學(xué)校大數(shù)據(jù)實(shí)驗(yàn)室專家和高校專業(yè)論證會(huì)。

圖書目錄

第1章  NoSQL數(shù)據(jù)庫(kù) 1
1.1  分布式存儲(chǔ)系統(tǒng) 1
1.1.1  分布式文件系統(tǒng) 1
1.1.2  GFS 2
1.1.3  BigTable介紹 3
1.2  NoSQL數(shù)據(jù)庫(kù) 5
1.2.1  NoSQL概述 5
1.2.2  NoSQL相關(guān)的基本概念 7
1.2.3  NoSQL分類 9
1.2.4  為什么選擇HBase 10
1.3  與其他數(shù)據(jù)庫(kù)的區(qū)別 11
1.3.1  NoSQL數(shù)據(jù)庫(kù)與SQL數(shù)據(jù)庫(kù)的
區(qū)別 11
1.3.2  NoSQL數(shù)據(jù)庫(kù)與NewSQL的
區(qū)別 12
1.4  習(xí)題 12
第2章  HBase體系架構(gòu) 14
2.1  HBase的基本概念 14
2.1.1  HBase的基礎(chǔ)概述 14
2.1.2  技術(shù)架構(gòu) 14
2.1.3  系統(tǒng)架構(gòu) 15
2.1.4  HBase讀取過(guò)程 15
2.1.5  HBase與關(guān)系型數(shù)據(jù)庫(kù)的區(qū)別 15
2.1.6  HBase與NewSQL的區(qū)別 16
2.1.7  HBase的應(yīng)用場(chǎng)景 16
2.2  HBase的各個(gè)組件 17
2.2.1  HMaster 17
2.2.2  HBase Client 17
2.2.3  ZooKeeper 17
2.2.4  HRegionServer 17
2.2.5  存儲(chǔ)單元Cell與數(shù)據(jù)寫入流程 19
2.3  案例01:HBase安裝部署與存儲(chǔ) 20
2.3.1  案例背景 20
2.3.2  案例預(yù)備知識(shí)點(diǎn) 20
2.3.3  案例環(huán)境要求 20
2.3.4  任務(wù)一:安裝和配置HBase 20
2.3.5  任務(wù)二:使用HBase操作用戶
數(shù)據(jù) 25
2.3.6  任務(wù)三:使用HBase進(jìn)行數(shù)據(jù)檢索與數(shù)據(jù)存儲(chǔ) 31
2.4  習(xí)題 35
第3章  HBase的接口 36
3.1  HBase接口的介紹 36
3.1.1  支持HBase API操作的相關(guān)組件 36
3.1.2  表Table和區(qū)域Region 37
3.1.3  Client 37
3.1.4  ZooKeeper 38
3.1.5  HMaster 38
3.2  HBase的API概述 39
3.3  HBase的常用Java API 40
3.4  案例02:HBase中Java API的使用 46
3.4.1  案例背景 46
3.4.2  案例預(yù)備知識(shí)點(diǎn) 46
3.4.3  案例環(huán)境要求 46
3.4.4  任務(wù)一:配置項(xiàng)目運(yùn)行環(huán)境 46
3.4.5  任務(wù)二:數(shù)據(jù)添加 50
3.4.6  任務(wù)三:數(shù)據(jù)獲取 51
3.4.7  任務(wù)四:數(shù)據(jù)刪除 54
3.4.8  任務(wù)五:查詢數(shù)據(jù) 56
3.5  習(xí)題 58
第4章  MapReduce與HBase 59
4.1  MapReduce介紹 59
4.1.1  什么是MapReduce 59
4.1.2  MapReduce的原理 60
4.1.3  MapReduce的特點(diǎn) 63
4.1.4  MapReduce應(yīng)用場(chǎng)景 63
4.2  MapReduce和HBase的關(guān)系 63
4.2.1  MapReduce在HBase中的作用 63
4.2.2  HBase和MapReduce的聯(lián)系和
區(qū)別 63
4.3  案例03:MapReduce與HBase實(shí)操 64
4.3.1  案例目標(biāo) 64
4.3.2  案例預(yù)備知識(shí)點(diǎn) 64
4.3.3  案例環(huán)境要求 64
4.3.4  任務(wù)一:HBase架構(gòu)深入剖析 64
4.3.5  任務(wù)二:HBase集成MapReduce 67
4.3.6  任務(wù)三:編寫MapReduce集成HBase對(duì)表數(shù)據(jù)的操作 71
4.4  習(xí)題 75
第5章  HBase表設(shè)計(jì) 76
5.1  HBase表的設(shè)計(jì) 76
5.1.1  HBase表概述 76
5.1.2  HBase表詳細(xì)設(shè)計(jì) 78
5.2  案例04:HBase創(chuàng)建表 79
5.2.1  案例目標(biāo) 79
5.2.2  案例預(yù)備知識(shí)點(diǎn) 79
5.2.3  案例環(huán)境要求 80
5.2.4  案例實(shí)施步驟 80
5.3  案例05:HBase存儲(chǔ)方式 82
5.3.1  案例目標(biāo) 82
5.3.2  案例預(yù)備知識(shí)點(diǎn) 82
5.3.3  案例環(huán)境要求 82
5.3.4  案例實(shí)施步驟 82
5.4  案例06:HBase對(duì)表進(jìn)行數(shù)據(jù)遷移 83
5.4.1  案例目標(biāo) 83
5.4.2  案例預(yù)備知識(shí)點(diǎn) 83
5.4.3  案例環(huán)境要求 83
5.4.4  案例實(shí)施步驟 84
5.5  案例07:話單表分析 85
5.5.1  案例目標(biāo) 85
5.5.2  案例預(yù)備知識(shí)點(diǎn) 86
5.5.3  案例環(huán)境要求 86
5.5.4  案例實(shí)施步驟 86
5.6  習(xí)題 92
第6章  HBase和Hive 94
6.1  企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)Hive的介紹和HBase整合 94
6.1.1  Hive的歷史 94
6.1.2  Hive簡(jiǎn)介 95
6.1.3  Hive技術(shù)架構(gòu) 95
6.1.4  Hive編程 100
6.1.5  Hive的應(yīng)用場(chǎng)景 102
6.1.6  Hive和HBase整合 103
6.2  案例08:HBase與Hive集成使用 105
6.2.1  案例目標(biāo) 105
6.2.2  案例預(yù)備知識(shí)點(diǎn) 105
6.2.3  案例環(huán)境要求 106
6.2.4  任務(wù)一:HBase集成Hive的環(huán)境
配置 106
6.2.5  任務(wù)二:集成環(huán)境中使用Hive創(chuàng)建
和查詢表 107
6.2.6  任務(wù)三:測(cè)試外部表集成
HBase 108
6.3  習(xí)題 109
第7章  HBase深入剖析 111
7.1  HBase性能優(yōu)化和測(cè)試 111
7.1.1  HBase性能優(yōu)化 111
7.1.2  客戶端性能優(yōu)化 113
7.1.3  HBase性能測(cè)試 114
7.2  案例09:對(duì)HBase表的深入剖析 116
7.2.1  案例目標(biāo) 116
7.2.2  案例預(yù)備知識(shí)點(diǎn) 116
7.2.3  案例環(huán)境要求 116
7.2.4  任務(wù)一:HBase表屬性和BlockCache配置 116
7.2.5  任務(wù)二:深入剖析HBase表的Compaction 119
7.3  案例10:HBase集群及表的管理 119
7.3.1  案例目標(biāo) 119
7.3.2  案例預(yù)備知識(shí)點(diǎn) 119
7.3.3  案例環(huán)境要求 120
7.3.4  任務(wù)一:HBase Master的Web UI
管理 120
7.3.5  任務(wù)二:HBase的Shell管理 125
7.3.6  任務(wù)三:HBase的其他管理
操作 126
7.4  習(xí)題 128
第8章  HBase項(xiàng)目實(shí)戰(zhàn)——論壇日志
分析 129
8.1  項(xiàng)目背景 129
8.2  項(xiàng)目設(shè)計(jì)目的 129
8.3  項(xiàng)目技術(shù)架構(gòu)和組成 130
8.4  項(xiàng)目任務(wù)分解 130
8.4.1  任務(wù)一:在Linux中上傳數(shù)據(jù)到
HDFS 130
8.4.2  任務(wù)二:使用MapReduce進(jìn)行數(shù)據(jù)
清洗 132
8.4.3  任務(wù)三:在Linux上執(zhí)行MR數(shù)據(jù)
清洗 135
8.4.4  任務(wù)四:使用Hive訪問(wèn)存放在
HDFS的數(shù)據(jù) 137
8.4.5  任務(wù)五:使用Kettle將數(shù)據(jù)存儲(chǔ)到HBase 139
8.4.6  任務(wù)六:使用Sqoop導(dǎo)入Hive數(shù)據(jù)
到MySQL 142
8.4.7  任務(wù)七:使用ECharts實(shí)現(xiàn)可
視化 143
8.5  項(xiàng)目總結(jié) 149

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)