注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書工具書科技工具書Hadoop與Spark入門

Hadoop與Spark入門

Hadoop與Spark入門

定 價:¥59.00

作 者: 覃雄派,陳躍國
出版社: 清華大學出版社
叢編項: 數(shù)據(jù)科學與大數(shù)據(jù)技術面向新工科專業(yè)建設計算機系列教材
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302613633 出版時間: 2022-11-01 包裝: 平裝
開本: 16開 頁數(shù): 233 字數(shù):  

內容簡介

  本書為一本大數(shù)據(jù)技術的入門書籍,介紹Hadoop大數(shù)據(jù)平臺和Spark大數(shù)據(jù)平臺及相關工具的原理,以及如何進行部署和簡單開發(fā)。全書包含13章: 、2章介紹如何為深入學習Hadoop和Spark做環(huán)境準備,包括VMware虛擬機的創(chuàng)建和CentOS操作系統(tǒng)安裝。第3~6章介紹Hadoop大數(shù)據(jù)平臺的基本原理,包括HDFS、MapReduce計算模型、HBase數(shù)據(jù)庫,以及Hive數(shù)據(jù)倉庫的原理、部署方法和開發(fā)技術。第7~11章介紹Spark大數(shù)據(jù)平臺的基本原理,包括彈性分布式數(shù)據(jù)集、轉換與動作操作、寬依賴與窄依賴、有向無環(huán)圖表達的作業(yè)及其處理過程等,并且介紹了Spark Core、Spark SQL、Spark MLlib、Spark GraphX的部署和開發(fā)技術。 兩章介紹了Flume( 2章)和Kafka( 3章)兩個工具,F(xiàn)lume用于大量日志的收集和處理,Kafka用于對大量快速到達的數(shù)據(jù)進行及時、可靠、暫時的存儲。本書適合高等院校高年級本科生以及碩士研究生使用,也可以供非計算機專業(yè)學生及相關領域技術人員參考。

作者簡介

  覃雄派,博士,中國人民大學信息學院講師、碩士生導師,目前主要從事高性能數(shù)據(jù)庫、大數(shù)據(jù)分析、信息檢索等方面的研究工作,主持1項 自然科學基金面上項目,參與多項 “863”計劃、“973”計劃及 自然科學基金項目,在 外期刊和會議上發(fā)表論文20余篇。

圖書目錄

第1章 VMware 與虛擬機
1.1 VMware簡介
1.2 VMware的安裝
1.3 VMware的網絡配置
1.3.1 VMnet0網卡配置
1.3.2 VMnet1網卡配置
1.3.3 VMnet8網卡配置
1.4 Windows環(huán)境下對VMnet8的DNS進行配置
1.5 利用管理員權限編輯網卡
1.6 總結
1.7 思考題
參考文獻
第2章 CentOS操作系統(tǒng)安裝
2.1 新建VMware虛擬機
2.2 安裝CentOS
2.3 配置Yum
2.4 為CentOS安裝圖形用戶界面
2.5 CentOS的網絡配置
2.5.1 虛擬機的網絡配置
2.5.2 在CentOS操作系統(tǒng)里對網卡進行設置
2.6 Samba配置
2.7 配置SSHD
2.8 重新啟動虛擬機需要執(zhí)行的命令
2.9 思考題
第3章 Hadoop入門
3.1 Hadoop簡介
3.2 HDFS
3.2.1 寫文件
3.2.2 讀文件
3.2.3 Secondary NameNode介紹
3.3 MapReduce 工作原理
3.3.1 MapReduce 執(zhí)行引擎
3.3.2 MapReduce 計算模型
3.3.3Hadoop 1.0 的應用
3.4 Hadoop 生態(tài)系統(tǒng)
3.5 Hadoop 2
3.5.1Hadoop 1.0 的優(yōu)勢和局限
3.5.2 從Hadoop 1.0 到Hadoop 2.0
3.5.3 YARN原理
3.5.4 YARN的優(yōu)勢
3.6 思考題
第4章 Hadoop安裝與HDFS、MapReduce實驗
4.1 安裝JDK
4.2 新建虛擬機集群
4.2.1 網絡配置小結
4.2.2 配置各個虛擬機別名
4.2.3 配置各個虛擬機的/etc/hosts文件
4.3 無密碼SSH登錄
4.4 Hadoop 安裝、配置和啟動
4.4.1 core-site.xml配置文件

本目錄推薦

掃描二維碼
Copyright ? 讀書網 ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號