注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件實(shí)用數(shù)據(jù)分析(原書第2版)

實(shí)用數(shù)據(jù)分析(原書第2版)

實(shí)用數(shù)據(jù)分析(原書第2版)

定 價(jià):¥59.00

作 者: [美] 赫克托·奎斯塔(Hector Cuesta),德爾·桑帕斯·庫(kù)馬爾(Dr.Sampath Kumar) 著;刁曉純 譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 大數(shù)據(jù)技術(shù)叢書
標(biāo) 簽: >程序設(shè)計(jì) >計(jì)算機(jī)/網(wǎng)絡(luò) >其他

ISBN: 9787111579212 出版時(shí)間: 2017-09-01 包裝: 平裝
開本: 16開 頁(yè)數(shù): 236 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書提供了一系列將數(shù)據(jù)轉(zhuǎn)化為重要結(jié)論的現(xiàn)實(shí)案例。書中覆蓋了廣泛的數(shù)據(jù)分析工具和算法,用于進(jìn)行分類分析、聚類分析、數(shù)據(jù)可視化、數(shù)據(jù)模擬以及預(yù)測(cè)。本書的目標(biāo)是幫助讀者了解數(shù)據(jù)從而找到相應(yīng)的模式、趨勢(shì)、相互關(guān)系以及重要結(jié)論。書中所包括的實(shí)用項(xiàng)目充分利用了MongoDB、D3.js和Python語(yǔ)言,并采用代碼片段和詳細(xì)描述的方式呈現(xiàn)本書的核心概念。

作者簡(jiǎn)介

  作 者 簡(jiǎn) 介About the AuthorHector Cuesta Dataxios(一家機(jī)器智能研發(fā)公司)的創(chuàng)辦人及首席數(shù)據(jù)科學(xué)家,擁有信息學(xué)士及計(jì)算機(jī)科學(xué)碩士學(xué)位。他在金融、零售、金融科技、在線學(xué)習(xí)、人力資源等領(lǐng)域提供數(shù)據(jù)驅(qū)動(dòng)產(chǎn)品設(shè)計(jì)的咨詢服務(wù)。在空閑時(shí)間,他熱衷于研究機(jī)器人??梢躁P(guān)注他的推特:https://twitter.com/hmCuesta。本書獻(xiàn)給我的妻子Yolanda和我可愛的孩子Damian和Issac,他們?yōu)槲业纳顜?lái)了無(wú)比的快樂(lè)。同時(shí)把本書獻(xiàn)給我的父母Elena和Miguel,感謝他們對(duì)我的支持和愛護(hù)。Dr. Sampath Kumar Telangana大學(xué)應(yīng)用統(tǒng)計(jì)系的助理教授和系主任,他擁有理學(xué)碩士、哲學(xué)碩士和統(tǒng)計(jì)學(xué)博士學(xué)位,擁有5年研究生教學(xué)經(jīng)驗(yàn),有超過(guò)4年的工作經(jīng)驗(yàn)。他是SAS和MATLAB軟件高級(jí)程序員,專長(zhǎng)是利用SPSS、SAS、R、Minitab、MATLAB等軟件進(jìn)行數(shù)據(jù)統(tǒng)計(jì)。他在不同的應(yīng)用學(xué)科和純統(tǒng)計(jì)專業(yè)(如預(yù)測(cè)建模、應(yīng)用回歸分析、多變量數(shù)據(jù)分析、運(yùn)營(yíng)管理等)方面具有教學(xué)經(jīng)驗(yàn)。

圖書目錄

譯者序
作者簡(jiǎn)介
審校者簡(jiǎn)介
前言
第1章 開始1
1.1 計(jì)算機(jī)科學(xué)1
1.2 人工智能2
1.3 機(jī)器學(xué)習(xí)2
1.4 統(tǒng)計(jì)學(xué)2
1.5 數(shù)學(xué)2
1.6 專業(yè)領(lǐng)域知識(shí)3
1.7 數(shù)據(jù)、信息和知識(shí)3
1.7.1 數(shù)據(jù)、信息和知識(shí)之間的相互性3
1.7.2 數(shù)據(jù)的本質(zhì)4
1.8 數(shù)據(jù)分析過(guò)程5
1.8.1 問(wèn)題6
1.8.2 數(shù)據(jù)準(zhǔn)備6
1.8.3 數(shù)據(jù)探索7
1.8.4 預(yù)測(cè)建模7
1.8.5 結(jié)果可視化8
1.9 定量與定性數(shù)據(jù)分析9
1.10 數(shù)據(jù)可視化的重要性9
1.11 大數(shù)據(jù)10
1.12 自我量化12
1.12.1 傳感器和攝像頭12
1.12.2 社交網(wǎng)絡(luò)分析13
1.13 本書的工具和練習(xí)13
1.13.1 為什么使用 Python14
1.13.2 為什么使用mlpy14
1.13.3 為什么使用D3.js14
1.13.4 為什么使用 MongoDB15
1.14 小結(jié)15
第2章 數(shù)據(jù)預(yù)處理16
2.1 數(shù)據(jù)源16
2.1.1 開源數(shù)據(jù)17
2.1.2 文本文件18
2.1.3 Excel文件18
2.1.4 SQL數(shù)據(jù)庫(kù)18
2.1.5 NoSQL數(shù)據(jù)庫(kù)19
2.1.6 多媒體20
2.1.7 網(wǎng)頁(yè)檢索20
2.2 數(shù)據(jù)清洗22
2.2.1 統(tǒng)計(jì)方法23
2.2.2 文本解析23
2.2.3 數(shù)據(jù)轉(zhuǎn)化25
2.3 數(shù)據(jù)格式25
2.3.1 CSV26
2.3.2 JSON27
2.3.3 XML28
2.3.4 YAML29
2.4 數(shù)據(jù)歸約30
2.4.1 過(guò)濾及抽樣30
2.4.2 分箱算法30
2.4.3 降維31
2.5 開始使用OpenRefine工具32
2.5.1 text facet33
2.5.2 聚類33
2.5.3 文本過(guò)濾器34
2.5.4 numeric facet34
2.5.5 數(shù)據(jù)轉(zhuǎn)化35
2.5.6 數(shù)據(jù)輸出36
2.5.7 操作歷史記錄36
2.6 小結(jié)37
第3章 可視化38
3.1 可視化概述39
3.2 利用網(wǎng)頁(yè)版的可視化39
3.3 探索科學(xué)可視化39
3.4 在藝術(shù)上的可視化40
3.5 可視化生命周期40
3.6 可視化不同類型的數(shù)據(jù)41
3.6.1 HTML41
3.6.2 DOM42
3.6.3 CSS42
3.6.4 JavaScript43
3.6.5 SVG43
3.7 開始使用D3.js43
3.7.1 柱狀圖44
3.7.2 餅圖48
3.7.3 散點(diǎn)圖50
3.7.4 單線圖52
3.7.5 多線圖55
3.8 交互與動(dòng)畫59
3.9 社交網(wǎng)絡(luò)中的數(shù)據(jù)61
3.10 可視化分析的摘要62
3.11 小結(jié)62
第4章 文本分類63
4.1 學(xué)習(xí)和分類63
4.2 貝葉斯分類64
4.3 E-mail主題測(cè)試器65
4.4 數(shù)據(jù)66
4.5 算法68
4.6 分類器的準(zhǔn)確性71
4.7 小結(jié)73
第5章 基于相似性的圖像檢索74
5.1 圖像相似性搜索74
5.2 動(dòng)態(tài)時(shí)間規(guī)整75
5.3 處理圖像數(shù)據(jù)集77
5.4 執(zhí)行DTW77
5.5 結(jié)果分析79
5.6 小結(jié)81
第6章 模擬股票價(jià)格82
6.1 金融時(shí)間序列82
6.2 隨機(jī)漫步模擬83
6.3 蒙特卡羅方法84
6.4 生成隨機(jī)數(shù)85
6.5 用D3.js實(shí)現(xiàn)86
6.6 計(jì)量分析師91
6.7 小結(jié)93
第7章 預(yù)測(cè)黃金價(jià)格94
7.1 處理時(shí)間序列數(shù)據(jù)94
7.2 平滑時(shí)間序列97
7.3 線性回歸100
7.4 數(shù)據(jù)—?dú)v史黃金價(jià)格101
7.5 非線性回歸101
7.5.1 核嶺回歸102
7.5.2 平滑黃金價(jià)格時(shí)間序列104
7.5.3 平滑時(shí)間序列的預(yù)測(cè)105
7.5.4 對(duì)比預(yù)測(cè)值106
7.6 小結(jié)107
第8章 使用支持向量機(jī)的方法進(jìn)行分析108
8.1 理解多變量數(shù)據(jù)集109
8.2 降維111
8.2.1 線性無(wú)差別分析112
8.2.2 主成分分析112
8.3 使用支持向量機(jī)114
8.3.1 核函數(shù)115
8.3.2 雙螺旋問(wèn)題116
8.3.3 在mlpy中實(shí)現(xiàn)SVM116
8.4 小結(jié)119
第9章 應(yīng)用細(xì)胞自動(dòng)機(jī)的方法對(duì)傳染病進(jìn)行建模120
9.1 流行病學(xué)簡(jiǎn)介120
9.2 流行病模型122
9.2.1 SIR模型122
9.2.2 使用SciPy來(lái)解決SIR模型的常微分方程123
9.2.3 SIRS模型124
9.3 對(duì)細(xì)胞自動(dòng)機(jī)進(jìn)行建模125
9.3.1 細(xì)胞、狀態(tài)、網(wǎng)格和鄰域126
9.3.2 整體隨機(jī)訪問(wèn)模型127
9.4 通過(guò)D3.js模擬CA中的SIRS模型127
9.5 小結(jié)135
第10章 應(yīng)用社交圖譜136
10.1 圖譜的結(jié)構(gòu)136
10.1.1 無(wú)向圖137
10.1.2 有向圖137
10.2 社交網(wǎng)絡(luò)分析137
10.3 捕獲Facebook圖譜138
10.4 使用Gephi再現(xiàn)圖譜139
10.5 統(tǒng)計(jì)分析142
10.6 度的分布144
10.6.1 圖譜直方圖145
10.6.2 集中度146
10.7 將GDF轉(zhuǎn)化為JSON148
10.8 在D3.js環(huán)境下進(jìn)行圖譜可視化150
10.9 小結(jié)154
第11章 分析Twitter數(shù)據(jù)155
11.1 解析Twitter數(shù)據(jù)155
11.1.1 tweet156
11.1.2 粉絲156
11.1.3 熱門話題156
11.2 使用OAuth訪問(wèn)Twitter API157
11.3 開始使用Twython158
11.3.1 利用Twython進(jìn)行簡(jiǎn)單查詢159
11.3.2 獲取時(shí)間表數(shù)據(jù)163
11.3.3 獲取粉絲數(shù)據(jù)165
11.3.4 獲取地點(diǎn)和趨勢(shì)信息167
11.3.5 獲取用戶數(shù)據(jù)168
11.3.6 API流169
11.4 小結(jié)171
第12章 使用MongoDB進(jìn)行數(shù)據(jù)處理和聚合172
12.1 開始使用MongoDB172
12.1.1 數(shù)據(jù)庫(kù)173
12.1.2 集合175
12.1.3 文件175
12.1.4 Mongo shell175
12.1.5 Insert/Update/Delete176
12.1.6 查詢177
12.2 數(shù)據(jù)準(zhǔn)備178
12.2.1 使用OpenRefine進(jìn)行數(shù)據(jù)轉(zhuǎn)換179
12.2.2 通過(guò)PyMongo插入文件180
12.3 分組182
12.4 聚合框架184
12.4.1 流水線184
12.4.2 表達(dá)式185
12.5 小結(jié)186
第13章 使用MapReduce方法188
13.1 MapReduce概述188
13.2 編程模型189
13.3 在MongoDB中使用MapReduce190
13.3.1 map函數(shù)190
13.3.2 reduce函數(shù)191
......

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)