注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡家庭與辦公軟件大數(shù)據(jù)導論

大數(shù)據(jù)導論

大數(shù)據(jù)導論

定 價:¥42.00

作 者: 李建偉 編
出版社: 北京郵電大學出版社
叢編項:
標 簽: 暫缺

ISBN: 9787563558810 出版時間: 2019-09-01 包裝: 平裝
開本: 16開 頁數(shù): 字數(shù):  

內容簡介

  《大數(shù)據(jù)導論》系統(tǒng)地介紹了大數(shù)據(jù)技術的基礎知識?!洞髷?shù)據(jù)導論》實戰(zhàn)環(huán)節(jié)的知識是在大數(shù)據(jù)培訓的基礎上總結提煉出來的,案例都為企業(yè)實際開發(fā)中的案例,所以內容的科學性和有效性已經被證實過,期望讀者通過對《大數(shù)據(jù)導論》的學習和對《大數(shù)據(jù)導論》案例的實踐,理解大數(shù)據(jù)技術的概念和原理,掌握Hadoop大數(shù)據(jù)技術中基礎和重要的知識和實踐。 《大數(shù)據(jù)導論》的主要內容包括大數(shù)據(jù)的概念及價值,Hadoop2.0介紹,分布式文件系統(tǒng)HDFS的原理、常用命令操作和編程實踐,分布式計算框架MapReduce的原理、基礎編程和高級編程,分布式資源管理系統(tǒng)YARN平臺,分布式鎖服務ZooKeeper,Hadoop高可用集群搭建和Hadoop實戰(zhàn)項目。 《大數(shù)據(jù)導論》可作為高等院校成人教育數(shù)據(jù)科學與大數(shù)據(jù)技術、計算機科學與技術和軟件工程等專業(yè)的大數(shù)據(jù)課程教材,也可作為相關技術人員的參考書。

作者簡介

  李建偉,2005年畢業(yè)于北京郵電大學,美國Marist College訪問學者,主要研究方向:智能自適應學習系統(tǒng)和大數(shù)據(jù)學習分析,曾主持研發(fā)了北京郵電大學網(wǎng)絡教育學院遠程教育平臺。主要參與的國家、省部級科研項目有國家“十五”重大科技攻關計劃“網(wǎng)絡教育關鍵技術及示范工程項目”,國家科技支撐計劃項目“虛擬實驗智能指導與管理系統(tǒng)的研發(fā)”,國家科技重大專項“寬帶無線校園創(chuàng)新實驗網(wǎng)體系架構與關鍵技術研究”等,已發(fā)表論文19篇,獲得國家發(fā)明專利2項,獲得北京市教學成果二等獎1次。

圖書目錄

第1章 大數(shù)據(jù)概述
1.1 大數(shù)據(jù)概念及價值
1.2 大數(shù)據(jù)數(shù)據(jù)源
1.3 大數(shù)據(jù)技術應用場景
1.4 大數(shù)據(jù)處理流程及技術
1.5 大數(shù)據(jù)與云計算的關系
1.6 大數(shù)據(jù)與人工智能的關系
本章小結
習題一
第2章 Hadoop介紹
2.1 Hadoop簡介
2.1.1 Hadoop由來
2.1.2 Hadoop發(fā)展歷程
2.1.3 Hadoop生態(tài)系統(tǒng)
2.2 Hadoop的體系架構
2.2.1 分布式文件系統(tǒng)HDFS
2.2.2 分布式計算框架MapReduce
2.2.3 分布式資源調度系統(tǒng)YARN
2.3 Hadoop依賴的技術基礎
2.3.1 Java編程基礎
2.3.2 Web可視化技術基礎
2.3.3 關系數(shù)據(jù)庫基礎
2.3.4 Linux基礎
2.4 Hadoop2.0集群搭建
2.4.1 偽分布式安裝部署
2.4.2 全分布式安裝部署
本章小結
習題二
第3章 分布式文件系統(tǒng)HDFS
3.1 HDFS簡介
3.2 HDFS的設計目標
3.3 HDFS的體系架構
3.3.1 主從架構
3.3.2 HDFS高可用性架構
3.4 HDFS的核心設計
3.4.1 數(shù)據(jù)復制
3.4.2 健壯性設計
3.4.3 數(shù)據(jù)組織
3.4.4 存儲空間回收機制
3.4.5 可訪問性
3.5 HDFS中數(shù)據(jù)流的讀寫
3.5.1 RPC實現(xiàn)流程
3.5.2 文件的讀取
3.5.3 文件的寫入
3.5.4 一致性模型
3.6 HDFS的聯(lián)邦機制
本章小結
習題三
第4章 訪問HDFS的常用接口
4.1 HDFS常用命令接口
4.2 HDFS編程環(huán)境準備
4.2.1 IDEA的安裝配置及特性
4.2.2 Maven的安裝配置
4.3 Java接口
4.3.1 在本地Windows機器上配置Hadoop環(huán)境變量
4.3.2 編寫Java客戶端程序
本章小結
習題四
第5章 分布式計算框架MapReduce
5.1 MapReduce編程模型簡介
5.1.1 產生背景
5.1.2 MapReduce編程模型
5.1.3 MapReduce工作流程
5.1.4 MapReduce兩個版本比較
5.2 MapReduce入門編程
5.2.1 認識Map和Reduce
5.2.2 MapTask階段
5.2.3 ReduceTask階段
本章小結
習題五
第6章 MapReduce基礎編程
6.1 MapReduce編程設計
6.1.1 MapReduce分布式計算模型
6.1.2 MapReduce分布式編程框架
6.2 MapReduce編程實例wordcount
6.2.1 wordcount開發(fā)需求分析
6.2.2 編程環(huán)境準備
6.2.3 編寫Mapper類
6.2.4 編寫Reducer類
6.2.5 MapReduce程序在YARN集群的運行機制
6.2.6 編寫YARN的客戶端
6.2.7 YARN集群的配置、作業(yè)打包和啟動
本章小結
習題六
第7章 分布式資源管理系統(tǒng)YARN
7.1 YARN簡介
7.2 發(fā)展史
7.2.1 Hadoop1.
7.2.2 Hadoop2.0和Hadoop1.0的區(qū)別
7.2.3 MapReduce計算框架的演變
7.3 YARN的架構
7.4 YARN集群執(zhí)行應用程序的工作流程
7.5 Hadoop如何使用YARN運行一個Job
7.6 YARN的調度策略
7.7 YARN的重要概念總結
本章小結
習題七
第8章 MapReduce高級編程
8.1 Combiner
8.2 Partitioner
8.3 計數(shù)器
8.4 排序
8.5 Join連接
8.6 倒排索引
8.7 求平均值和數(shù)據(jù)去重
本章小結
習題八
第9章 分布式鎖服務ZooKeeper
9.1 ZooKeeper基本概念介紹
9.1.1 ZooKeeper的定義
9.1.2 ZooKeeper的基本原理和應用場景
9.1.3 ZooKeeper的選舉機制
9.1.4 ZooKeeper的存儲機制
9.2 ZooKeeper集群部署
9.3 ZooKeeper編程實例
9.3.1 ZooKeeper API基礎知識
9.3.2 ZooKeeper API介紹及編程實例
本章小結
習題九
第10章 Hadoop高可用集群搭建
10.1 HDFS高可用的工作機制
10.2 集群規(guī)劃
10.3 Hadoop HA集群搭建
10.3.1 前期準備
10.3.2 安裝ZooKeeper集群
10.3.3 安裝Hadoop集群
10.3.4 啟動集群
10.3.5 測試
本章小結
習題十
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號