注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡家庭與辦公軟件Hadoop大數(shù)據(jù)分析

Hadoop大數(shù)據(jù)分析

Hadoop大數(shù)據(jù)分析

定 價:¥38.00

作 者: 高永彬,錢亮宏,方志軍 著
出版社: 中國鐵道出版社
叢編項: 高等學校大數(shù)據(jù)技術與應用規(guī)劃教材
標 簽: 暫缺

購買這本書可以去


ISBN: 9787113259198 出版時間: 2019-07-01 包裝: 平裝
開本: 16開 頁數(shù): 184 字數(shù):  

內(nèi)容簡介

  本書適合作為高等學校計算機、通信與網(wǎng)絡工程等本科專業(yè)的教材,也可作為相關學科專業(yè)碩士研究生、信息網(wǎng)絡規(guī)劃設計人員、網(wǎng)絡運行管理維護人員和網(wǎng)絡管理技術科研人員的參考用書。

作者簡介

  高永彬:博士、講師,就職于上海工程技術大學,博士畢業(yè)于韓國全北國立大學,在模式識別、機器學習領域積累了大量的研究與實戰(zhàn)經(jīng)驗。特別地,在基于深度學習技術的人臉識別以及車型檢測技術進行了深入地研究,發(fā)表了近30篇期刊/會議論文,取得了豐厚的研究成果,發(fā)表在包括Information Sciences, Pattern Recognition Letters等高水平期刊中,其中SCI收錄5篇,EI收錄4篇。錢亮宏,男,畢業(yè)于上海交通大學電子信息與電氣工程學院,1989年8月出生,擁有10年R語言使用經(jīng)驗,一直奮戰(zhàn)在數(shù)據(jù)分析與挖掘領域的線,作為金融和互聯(lián)網(wǎng)行業(yè)資深數(shù)據(jù)挖掘專家。方志軍,男,教授,現(xiàn)任上海工程技術大學電子電氣工程學院院長,1971年9月出生,主要從事人工智能、機器視覺、大數(shù)據(jù)分析等方面的研究,主講課程包括數(shù)字圖像處理、機器視覺、計算機導論、大數(shù)據(jù)導論和程序設計等。

圖書目錄

第1部分 Hadoop核心基礎
第1章 Hadoop簡介 2
1.1 Hadoop產(chǎn)生背景 2
1.2 Hadoop簡要歷史 3
1.3 Hadoop生態(tài)系統(tǒng)組件 3
1.4 Hadoop版本和商用支持 5
1.5 Hadoop的基礎環(huán)境配置 6
1.6 Hadoop的安裝 7
1.7 Hadoop的配置 11
1.8 Hadoop的運行 14
小結 19
習題 19
第2章 HDFS文件系統(tǒng) 20
2.1 HDFS簡介 20
2.2 HDFS架構 20
2.3 HDFS文件塊 21
2.4 HDFS常用操作 22
小結 24
習題 24
第3章 YARN資源管理 25
3.1 YARN架構 25
3.2 YARN調(diào)度策略 26
3.3 YARN常用操作 28
小結 30
習題 31
第4章 MapReduce計算框架 32
4.1 MapReduce原理 32
4.2 MapReduce作業(yè)數(shù)據(jù)流 33
4.3 Hadoop流處理 35
4.4 MapReduce程序實現(xiàn)詞頻
統(tǒng)計 35
4.5 MapReduce程序的Reducer
數(shù)量 40
4.6 MapReduce程序的Combiner 41
4.7 MapReduce程序實現(xiàn)數(shù)據(jù)
連接 43
小結 49
習題 49
第2部分 Hive數(shù)據(jù)倉庫
第5章 Hive簡介 52
5.1 Hive概述 52
5.2 Hive的安裝 53
5.3 Hive的運行 56
小結 59
習題 59
第6章 Hive數(shù)據(jù)定義 60
6.1 數(shù)據(jù)庫操作 60
6.2 數(shù)據(jù)表基本操作 62
6.3 存儲格式和行格式 65
6.4 數(shù)據(jù)類型 67
6.5 外部表 70
6.6 分區(qū)表 72
小結 74
習題 74

第7章 Hive數(shù)據(jù)操作 75
7.1 數(shù)據(jù)導入 75
7.2 數(shù)據(jù)插入 78
7.3 數(shù)據(jù)導出 82
小結 84
習題 84
第8章 Hive數(shù)據(jù)查詢 85
8.1 基本查詢 85
8.2 數(shù)據(jù)聚合 87
8.3 數(shù)據(jù)連接 90
小結 92
習題 93
第3部分 Spark數(shù)據(jù)分析
第9章 Spark簡介 96
9.1 Spark概述 96
9.2 Spark原理 97
9.3 Spark的安裝 98
9.4 Spark運行方式 99
9.5 Spark運行位置 101
9.6 Spark運行參數(shù) 104
小結 104
習題 104
第10章 Spark大數(shù)據(jù)處理 105
10.1 數(shù)據(jù)框的創(chuàng)建 105
10.2 數(shù)據(jù)框的選擇 107
10.3 數(shù)據(jù)框的運算和聚合 110
10.4 數(shù)據(jù)框的增加、刪除
和修改 114
10.5 數(shù)據(jù)框的連接 116
10.6 數(shù)據(jù)框的變形 119
小結 120
習題 120
第11章 Spark機器學習流程 121
11.1 數(shù)據(jù)探索 122
11.2 數(shù)據(jù)劃分 123
11.3 數(shù)據(jù)填充 124
11.4 類別變量處理 125
11.5 特征選擇 128
11.6 建模與調(diào)優(yōu) 131
11.7 測試與評估 133
小結 135
習題 135
第12章 Spark有監(jiān)督學習模型 136
12.1 線性回歸模型 140
12.2 邏輯回歸模型 142
12.3 決策樹模型 145
12.4 隨機森林模型 152
12.5 神經(jīng)網(wǎng)絡 158
12.6 協(xié)同過濾 163
小結 166
習題 166
第13章 Spark無監(jiān)督學習模型 167
13.1 k均值聚類模型 168
13.2 主成分分析模型 172
13.3 關聯(lián)分析模型 173
小結 176
習題 176

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號