注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡家庭與辦公軟件大數(shù)據(jù)技術導論

大數(shù)據(jù)技術導論

大數(shù)據(jù)技術導論

定 價:¥39.00

作 者: 程顯毅 著
出版社: 機械工業(yè)出版社
叢編項: “十三五”普通高等教育規(guī)劃教材
標 簽: 暫缺

ISBN: 9787111621713 出版時間: 2019-04-01 包裝: 平裝
開本: 16開 頁數(shù): 175 字數(shù):  

內(nèi)容簡介

  本書以面向應用、面向?qū)崙?zhàn)為指導思想,緊扣企業(yè)技術人才培養(yǎng)的特點,在知識點講解和實驗中避免復雜的理論,使讀者能快速上手體驗、驗證大數(shù)據(jù)處理的魅力,以激發(fā)讀者的學習興趣。 本書覆蓋了大數(shù)據(jù)生命周期中的主要技術要點,全書共8章,第1章介紹大數(shù)據(jù)的產(chǎn)生和特點及思維的變革,第2章了解大數(shù)據(jù)生態(tài)系統(tǒng),第3~7章按照大數(shù)據(jù)的生命周期,分別討論大數(shù)據(jù)采集與預處理、大數(shù)據(jù)管理、大數(shù)據(jù)分析、大數(shù)據(jù)可視化、大數(shù)據(jù)應用的基本原理和方法,第8章討論大數(shù)據(jù)安全面臨的挑戰(zhàn)。 本書可作為本科、高職院校大數(shù)據(jù)技術或數(shù)據(jù)科學課程的參考書或教材,也可供數(shù)據(jù)科學相關技術人員閱讀。

作者簡介

暫缺《大數(shù)據(jù)技術導論》作者簡介

圖書目錄

目 錄

前言
第1章 概論1
1.1 揭秘大數(shù)據(jù)1
1.1.1 大數(shù)據(jù)產(chǎn)生歷史必然1
1.1.2 大數(shù)據(jù)概念和特征2
1.1.3 大數(shù)據(jù)生命周期3
1.1.4 大數(shù)據(jù)與物聯(lián)網(wǎng)、云計算、人工智能5
1.1.5 大數(shù)據(jù)時代的八個重大變革5
1.2 Linux系統(tǒng)概述7
1.2.1 Linux版本7
1.2.2 Linux系統(tǒng)目錄結構7
1.2.3 文本編輯器vi9
1.2.4 文件權限解讀10
1.2.5 Linux系統(tǒng)常用命令11
習題112
實驗報告1 Linux實驗13
第2章 大數(shù)據(jù)生態(tài)系統(tǒng)15
2.1 認識Hadoop15
2.2 HDFS16
2.2.1 HDFS體系結構16
2.2.2 HDFS存儲原理17
2.2.3 HDFS常用操作20
2.3 MapReduce21
2.3.1 MapReduce邏輯結構21
2.3.2 MapReduce操作案例23
*2.4 Zookeeper24
習題225
實驗報告2 Hadoop實驗27
第3章 大數(shù)據(jù)采集與預處理29
3.1 數(shù)據(jù)29
3.1.1 數(shù)據(jù)是什么29
3.1.2 數(shù)據(jù)分類29
3.1.3 度量和維度31
3.2 數(shù)據(jù)采集32
3.2.1 數(shù)據(jù)采集分類32
3.2.2 數(shù)據(jù)采集方法32
3.2.3 數(shù)據(jù)采集工具32
3.3 數(shù)據(jù)清洗34
3.3.1 數(shù)據(jù)清洗任務34
3.3.2 數(shù)據(jù)清洗過程34
3.4 數(shù)據(jù)變換35
3.4.1 規(guī)范化36
3.4.2 函數(shù)變換36
3.5 網(wǎng)絡爬蟲37
3.5.1 爬蟲簡介37
*3.5.2 論壇爬蟲源代碼分析38
習題340
*實驗報告3 網(wǎng)絡爬蟲41
第4章 大數(shù)據(jù)管理42
4.1 NoSQL42
4.1.1 NoSQL概述42
4.1.2 鍵值數(shù)據(jù)庫43
4.1.3 圖數(shù)據(jù)庫44
4.1.4 文檔數(shù)據(jù)庫45
4.1.5 列式數(shù)據(jù)庫47
4.1.6 云數(shù)據(jù)庫47
4.2 HBase47
4.2.1 HBase模型47
4.2.2 HBase與傳統(tǒng)關系數(shù)據(jù)庫的對比分析49
4.2.3 HBase系統(tǒng)架構49
4.2.4 HBase常用Shell命令51
習題452
實驗報告4 HBase實驗53
第5章 大數(shù)據(jù)分析54
5.1 大數(shù)據(jù)分析概述54
5.1.1 數(shù)據(jù)分析原則54
5.1.2 大數(shù)據(jù)分析特點54
5.1.3 大數(shù)據(jù)分析流程55
5.1.4 數(shù)據(jù)分析師基本技能和素質(zhì)57
*5.1.5 大數(shù)據(jù)分析難點58
*5.2 業(yè)務理解59
5.2.1 什么是業(yè)務理解59
5.2.2 如何理解業(yè)務60
5.2.3 數(shù)據(jù)業(yè)務化61
5.3 數(shù)據(jù)認知63
5.3.1 數(shù)據(jù)預處理63
5.3.2 概率分析63
*5.3.3 對比分析67
*5.3.4 細分分析68
*5.3.5 交叉分析69
5.3.6 相關分析69
5.4 特征工程72
5.4.1 特征工程面臨的挑戰(zhàn)72
5.4.2 特征選擇72
5.4.3 特征提取72
5.4.4 指標設計73
5.5 數(shù)據(jù)建模76
5.5.1 模型分類76
5.5.2 決策樹77
5.5.3 關聯(lián)分析81
5.5.4 回歸分析82
5.5.5 聚類分析85
*5.5.6 k-鄰近分類算法KNN86
*5.6 通用計算引擎Spark86
5.6.1 Spark簡介86
5.6.2 Spark與Hadoop差異88
5.6.3 Spark適用場景88
5.6.4 Spark運行模式89
5.6.5 Spark常用術語89
5.7 大數(shù)據(jù)分析引擎Hive89
5.7.1 數(shù)據(jù)倉庫概念89
5.7.2 傳統(tǒng)數(shù)據(jù)倉庫的問題90
5.7.3 Hive特征90
5.7.4 Hive系統(tǒng)架構90
5.7.5 Hive應用案例91
習題595
實驗報告5 Hive實驗101
第6章 大數(shù)據(jù)可視化102
6.1 數(shù)據(jù)可視化基本概念102
6.1.1 為什么要數(shù)據(jù)可視化102
6.1.2 什么是數(shù)據(jù)可視化103
6.1.3 數(shù)據(jù)可視化的作用104
6.1.4 數(shù)據(jù)可視化術語104
6.1.5 數(shù)據(jù)可視化三要素105
6.2 常用圖形105
6.2.1 餅圖(扇形圖)105
6.2.2 堆積柱形圖106
6.2.3 風玫瑰圖106
6.2.4 柱狀圖107
6.2.5 直方圖107
6.2.6 氣泡圖108
6.2.7 散點圖矩陣108
6.2.8 折線圖109
6.2.9 面積圖109
6.2.10 相關系數(shù)圖110
6.2.11 雷達圖110
6.2.12 箱線圖110
6.3 數(shù)據(jù)可視化設計111
6.3.1 數(shù)據(jù)可視化設計原則111
6.3.2 數(shù)據(jù)可視化=數(shù)據(jù)+設計+故事113
6.3.3 數(shù)據(jù)可視化圖形選擇建議113
6.4 數(shù)據(jù)可視化工具114
6.4.1 基本工具114
6.4.2 進階工具114
6.5 基于R語言可視化基礎117
6.5.1 基本繪圖命令117
6.5.2 ggplot2繪圖121
習題6128
*實驗報告6 可視化實驗129
第7章 大數(shù)據(jù)應用131
7.1 零售行業(yè)大數(shù)據(jù)131
7.1.1 沃爾瑪?shù)馁徫锘@分析131
7.1.2 農(nóng)夫山泉用海量照片提升銷量132
7.2 交通大數(shù)據(jù)134
7.2.1 交通擁堵大數(shù)據(jù)分析134
7.2.2 預測起飛時間142
7.3 醫(yī)療大數(shù)據(jù)143
7.3.1 移動醫(yī)療與個人健康143
7.3.2 基因測序——精準治癌正在成為現(xiàn)實146
第8章 大數(shù)據(jù)安全150
8.1 大數(shù)據(jù)安全的重要意義150
8.2 大數(shù)據(jù)面臨的挑戰(zhàn)151
8.3 大數(shù)據(jù)的安全威脅152
8.3.1 大數(shù)據(jù)基礎設施安全威脅152
8.3.2 大數(shù)據(jù)存儲安全威脅152
8.3.3 大數(shù)據(jù)的隱私泄露153
8.3.4 大數(shù)據(jù)的其他安全威脅155
8.4 大數(shù)據(jù)與網(wǎng)絡攻擊監(jiān)測155
8.5 大數(shù)據(jù)安全分析155
8.6 大數(shù)據(jù)安全標準157
8.6.1 基礎標準類158
8.6.2 平臺和技術類158
8.6.3 數(shù)據(jù)安全類159
8.6.4 服務安全類159
8.6.5 應用安全類160
附錄 大數(shù)據(jù)軟件安裝161
A.1 基礎環(huán)境準備161
A.2 安裝JDK162
A.3 安裝Hadoop162
A.4 安裝Zookeeper167
A.5 安裝HBase169
A.6 安裝Hive170
A.7 安裝Spark172
參考文獻175

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號