定 價:¥59.00
作 者: | (西)勞拉·伊瓜爾,桑蒂·塞吉 |
出版社: | 機械工業(yè)出版社 |
叢編項: | |
標 簽: | 暫缺 |
ISBN: | 9787111604648 | 出版時間: | 2018-09-01 | 包裝: | |
開本: | 頁數(shù): | 字數(shù): |
譯者序
原書前言
作者和貢獻者簡介
第1章 數(shù)據(jù)科學概述 // 1
1.1 什么是數(shù)據(jù)科學 //1
1.2 關(guān)于本書 //2
第2章 數(shù)據(jù)專家的工具箱 //4
2.1 引言 // 4
2.2 為什么選擇Python // 4
2.3 數(shù)據(jù)專家的基本Python庫 // 5
2.3.1 數(shù)值和科學計算:NumPy和SciPy // 5
2.3.2 Scikit-learn:Python中的機器學習庫 // 5
2.3.3 Pandas:Python數(shù)據(jù)分析庫 // 5
2.4 數(shù)據(jù)科學生態(tài)系統(tǒng)的安裝 // 6
2.5 集成開發(fā)環(huán)境 // 6
2.5.1 網(wǎng)絡(luò)集成開發(fā)環(huán)境:Jupyter // 7
2.6 數(shù)據(jù)專家從Python開始 // 7
2.6.1 讀取 // 11
2.6.2 選擇數(shù)據(jù) // 13
2.6.3 篩選數(shù)據(jù) // 14
2.6.4 篩選缺失的數(shù)據(jù) // 15
2.6.5 處理數(shù)據(jù) // 15
2.6.6 排序 // 19
2.6.7 分組數(shù)據(jù) // 20
2.6.8 重排數(shù)據(jù) // 21
2.6.9 對數(shù)據(jù)進行排名 // 22
2.6.10 繪圖 // 23
2.7 小結(jié) // 24
第3章 描述統(tǒng)計學 // 25
3.1 引言 // 25
3.2 數(shù)據(jù)準備 // 25
3.2.1 Adult數(shù)據(jù)集示例 // 26
3.3 探索性數(shù)據(jù)分析 // 28
3.3.1 匯總數(shù)據(jù) // 28
3.3.2 數(shù)據(jù)分布 // 31
3.3.3 離群點的處理 // 33
3.3.4 測量不對稱性:偏度和皮爾遜中值偏度系數(shù) // 36
3.3.5 連續(xù)分布 // 38
3.3.6 核密度 // 39
3.4 估計 // 41
3.4.1 樣本和估計均值、方差和標準記分 // 41
3.4.2 協(xié)方差、皮爾遜相關(guān)和斯皮爾曼秩相關(guān) // 42
3.5 小結(jié) // 44
參考文獻 // 45
第4章 統(tǒng)計推斷 // 46
4.1 引言 // 46
4.2 統(tǒng)計推斷:頻率論方法 // 46
4.3 測量估計的差異性 // 47
4.3.1 點估計 // 47
4.3.2 置信區(qū)間 // 50
4.4 假設(shè)檢驗 // 53
4.4.1 用置信區(qū)間檢驗假設(shè) // 53
4.4.2 使用p值檢驗假設(shè) // 55
4.5 效應(yīng)E是真實的嗎 // 57
4.6 小結(jié) // 57
參考文獻 // 58
第5章 監(jiān)督學習 // 59
5.1 引言 // 59
5.2 問題 // 60
5.3 第一步 // 60
5.4 什么是學習? // 69
5.5 學習曲線 // 70
5.6 訓練、驗證和測試 // 73
5.7 兩種學習模型 // 76
5.7.1 學習三要素 // 76
5.7.2 支持向量機 // 77
5.7.3 隨機森林 // 79
5.8 結(jié)束學習過程 // 80
5.9 商業(yè)案例 // 81
5.10 小結(jié) // 83
參考文獻 // 83
第6章 回歸分析 // 84
6.1 引言 // 84
6.2 線性回歸 // 84
6.2.1 簡單線性回歸 // 85
6.2.2 多元線性回歸和多項式回歸 // 90
6.2.3 稀疏模型 // 90
6.3 邏輯斯蒂回歸 // 97
6.4 小結(jié) // 99
參考文獻 // 99
第7章 無監(jiān)督學習 // 100
7.1 引言 // 100
7.2 聚類 // 100
7.2.1 相似度和距離 // 101
7.2.2 什么是一個好的聚類?定義衡量聚類質(zhì)量的度量 // 101
7.2.3 聚類技術(shù)的分類標準 // 104
7.3 案例學習 // 113
7.4 小結(jié) // 118
參考文獻 // 119
第8章 網(wǎng)絡(luò)分析 // 120
8.1 引言 // 120
8.2 圖的基本定義 // 121
8.3 社交網(wǎng)絡(luò)分析 // 122
8.3.1 NetworkX基礎(chǔ) // 122
8.3.2 實際案例:Facebook數(shù)據(jù)集 // 123
8.4 中心性 // 125
8.4.1 在圖中繪制中心性 // 130
8.4.2 PageRank // 132
8.5 自我網(wǎng)絡(luò) // 134
8.6 社區(qū)發(fā)現(xiàn) // 138
8.7 小結(jié) // 139
參考文獻 // 139
第9章 推薦系統(tǒng) // 140
9.1 引言 // 140
9.2 推薦系統(tǒng)如何工作? // 140
9.2.1 基于內(nèi)容的過濾 // 141
9.2.2 協(xié)作過濾 // 141
9.2.3 混合推薦系統(tǒng) // 141
9.3 建模用戶偏好 // 142
9.4 評估推薦系統(tǒng) // 142
9.5 實際案例 // 143
9.5.1 MovieLens數(shù)據(jù)集 // 143
9.5.2 基于用戶的協(xié)作過濾 // 145
9.6 小結(jié) // 153
參考文獻 // 153
第10章 用于情感分析的統(tǒng)計自然語言處理 // 154
10.1 引言 // 154
10.2 數(shù)據(jù)清洗 // 155
10.3 文本表示 // 158
10.3.1 二元組和n元組 // 163
10.4 實際案例 // 163
10.5 小結(jié) // 168
參考文獻 // 168
第11章 并行計算 // 169
11.1 引言 // 169
11.2 架構(gòu) // 170
11.2.1 入門指南 // 171
11.2.2 連接到集群(引擎)// 171
11.3 多核編程 // 172
11.3.1 引擎的直接視圖 // 172
11.3.2 引擎的負載均衡視圖 // 175
11.4 分布式計算 // 176
11.5 實際應(yīng)用:紐約出租車旅行 // 177
11.5.1 直接視圖非阻塞方案 // 178
11.5.2 實驗結(jié)果 // 180
11.6 小結(jié) // 182
參考文獻 // 182