定 價:¥79.00
作 者: | 王雪迎 |
出版社: | 清華大學出版社 |
叢編項: | |
標 簽: | 暫缺 |
ISBN: | 9787302518945 | 出版時間: | 2019-01-01 | 包裝: | 平裝 |
開本: | 16開 | 頁數(shù): | 342 | 字數(shù): |
目 錄
第1章 MADlib基礎(chǔ) 1
1.1 基本概念 1
1.1.1 MADlib是什么 1
1.1.2 MADlib的設(shè)計思想 2
1.1.3 MADlib的工作原理 3
1.1.4 MADlib的執(zhí)行流程 4
1.1.5 MADlib架構(gòu) 5
1.2 MADlib的功能 6
1.2.1 MADlib支持的模型類型 6
1.2.2 MADlib的主要功能模塊 7
1.3 MADlib的安裝與卸載 9
1.3.1 確定安裝平臺 9
1.3.2 下載MADlib二進制壓縮包 10
1.3.3 安裝MADlib 10
1.3.4 卸載MADlib 12
1.4 小結(jié) 13
第2章 數(shù)據(jù)類型 14
2.1 向量 14
2.1.1 MADlib中的向量操作函數(shù) 15
2.1.2 稀疏向量 23
2.2 矩陣 30
2.2.1 矩陣定義 31
2.2.2 MADlib中的矩陣表示 31
2.2.3 MADlib中的矩陣運算函數(shù) 32
2.3 小結(jié) 49
第3章 數(shù)據(jù)轉(zhuǎn)換 50
3.1 鄰近度 50
3.1.1 MADlib的鄰近度相關(guān)函數(shù) 50
3.1.2 距離度量的中心化和標準化 57
3.1.3 選取正確的鄰近度度量 58
3.2 矩陣分解 59
3.2.1 低秩矩陣分解 59
3.2.2 奇異值分解 70
3.3 透視表 87
3.4 分類變量編碼 97
3.5 小結(jié) 110
第4章 數(shù)據(jù)探索 111
4.1 描述性統(tǒng)計 111
4.1.1 皮爾森相關(guān) 111
4.1.2 匯總統(tǒng)計 117
4.2 概率統(tǒng)計 125
4.2.1 概率 125
4.2.2 統(tǒng)計推論 133
4.3 主成分分析 147
4.3.1 背景知識 147
4.3.2 MADlib的PCA相關(guān)函數(shù) 149
4.3.3 MADlib的PCA應用示例 155
4.4 小結(jié) 160
第5章 回歸 161
5.1 線性回歸 161
5.1.1 背景知識 161
5.1.2 MADlib的線性回歸相關(guān)函數(shù) 164
5.1.3 線性回歸示例 166
5.2 非線性回歸 171
5.2.1 背景知識 171
5.2.2 MADlib的非線性回歸相關(guān)
函數(shù) 172
5.2.3 非線性回歸示例 175
5.3 邏輯回歸 179
5.3.1 背景知識 179
5.3.2 MADlib的邏輯回歸相關(guān)函數(shù) 180
5.3.3 邏輯回歸示例 182
5.4 多類回歸 187
5.4.1 背景知識 187
5.4.2 MADlib的多類回歸相關(guān)函數(shù) 190
5.4.3 多類回歸示例 192
5.5 序數(shù)回歸 196
5.5.1 背景知識 196
5.5.2 MADlib的序數(shù)回歸相關(guān)函數(shù) 197
5.5.3 序數(shù)回歸示例 200
5.6 彈性網(wǎng)絡回歸 202
5.6.1 背景知識 202
5.6.2 MADlib的彈性網(wǎng)絡回歸相關(guān)
函數(shù) 204
5.6.3 彈性網(wǎng)絡回歸示例 209
5.7 小結(jié) 221
第6章 時間序列分析 222
6.1 背景知識 222
6.1.1 時間序列分析方法 222
6.1.2 ARIMA模型 223
6.2 MADlib中ARIMA相關(guān)函數(shù) 225
6.3 時間序列分析示例 228
6.4 小結(jié) 232
第7章 分類 233
7.1 K近鄰 233
7.1.1 背景知識 233
7.1.2 MADlib中K近鄰函數(shù) 235
7.1.3 K近鄰示例 236
7.2 樸素貝葉斯 240
7.2.1 背景知識 240
7.2.2 MADlib中樸素貝葉斯分類
相關(guān)函數(shù) 242
7.2.3 樸素貝葉斯分類示例 244
7.3 支持向量機 249
7.3.1 背景知識 249
7.3.2 MADlib的支持向量機相關(guān)
函數(shù) 252
7.3.3 支持向量機示例 258
7.4 決策樹 264
7.4.1 背景知識 264
7.4.2 MADlib的決策樹相關(guān)函數(shù) 267
7.4.3 決策樹示例 272
7.5 隨機森林 281
7.5.1 背景知識 281
7.5.2 MADlib的隨機森林相關(guān)函數(shù) 282
7.5.3 隨機森林示例 287
7.6 小結(jié) 293
第8章 聚類 294
8.1 背景知識 294
8.1.1 聚類的概念 294
8.1.2 k-means方法 295
8.2 MADlib的k-means相關(guān)函數(shù) 297
8.2.1 訓練函數(shù) 298
8.2.2 簇分配函數(shù) 300
8.2.3 輪廓系數(shù)函數(shù) 301
8.3 k-means示例 301
8.4 小結(jié) 307
第9章 關(guān)聯(lián)規(guī)則 308
9.1 背景知識 308
9.1.1 基本概念 308
9.1.2 Apriori算法 311
9.2 MADlib的Apriori算法函數(shù) 312
9.3 Apriori應用示例 313
9.4 小結(jié) 319
第10章 圖算法 320
10.1 背景知識 320
10.1.1 基本概念 320
10.1.2 常見圖算法 321
10.1.3 單源最短路徑 323
10.2 MADlib的單源最短路徑相關(guān)函數(shù) 324
10.3 單源最短路徑示例 325
10.4 小結(jié) 327
第11章 模型評估 328
11.1 交叉驗證 328
11.1.1 背景知識 328
11.1.2 MADlib的交叉驗證相關(guān)
函數(shù) 331
11.1.3 交叉驗證示例 333
11.2 預測度量 336
11.3 小結(jié) 342