定 價:¥59.00
作 者: | 黃翼 |
出版社: | 清華大學出版社 |
叢編項: | |
標 簽: | 暫缺 |
ISBN: | 9787302626046 | 出版時間: | 2023-05-01 | 包裝: | 平裝 |
開本: | 16開 | 頁數(shù): | 字數(shù): |
第一部分 大數(shù)據(jù)基礎
第一章 大數(shù)據(jù)導論 3
一、什么是大數(shù)據(jù) 3
二、為何要做數(shù)據(jù)挖掘 5
三、數(shù)據(jù)分析的應用 7
練習題 10
第二章 大數(shù)據(jù)技術 11
一、大數(shù)據(jù)的技術框架 11
二、與大數(shù)據(jù)處理相關的技術 12
三、數(shù)據(jù)挖掘的一般流程 14
練習題 16
第二部分 Python編程基礎
第三章 Python環(huán)境搭建 19
一、Python的版本與安裝 19
二、PyCharm的安裝與使用 23
三、Anaconda的安裝與使用 27
練習題 30
第四章 Python編程基礎 31
一、Python變量設定和賦值數(shù)據(jù)類型 31
二、Python的運算符 38
三、控制流 42
四、常用函數(shù) 49
五、Python基礎語法 50
練習題 54
第五章 Python數(shù)據(jù)挖掘 55
一、NumPy模塊 55
二、Pandas模塊 68
練習題 106
第六章 Python數(shù)據(jù)可視化 107
一、數(shù)據(jù)可視化 107
二、Pandas繪圖 111
三、Matplotlib其他繪圖 120
練習題 123
第三部分 數(shù)據(jù)挖掘基礎
第七章 數(shù)據(jù)預處理 127
一、數(shù)據(jù)存在的問題 127
二、數(shù)據(jù)預處理的手段 129
練習題 138
第八章 多元線性回歸 139
一、介紹 139
二、解釋模型與預測模型 139
三、回歸方程的估計與預測 140
四、線性回歸中的變量選擇 141
練習題 143
第九章 K-NN算法 145
一、K-NN分類器(分類結果) 145
二、K-NN表示數(shù)值結果 147
三、K-NN算法的優(yōu)勢和劣勢 147
練習題 147
第十章 樸素貝葉斯分類器 149
一、介紹 149
二、使用完全(精確)貝葉斯分類器預測 150
三、樸素貝葉斯分類器的優(yōu)缺點 153
練習題 155
第十一章 分類回歸樹 156
一、介紹 156
二、分類樹 157
三、評估分類樹的性能 161
四、避免過度擬合 162
五、樹的分類規(guī)則 164
六、兩類以上的分類樹 164
七、回歸樹 165
八、改進預測:隨機森林和增強樹 166
九、樹的優(yōu)點和缺點 167
練習題 167
第十二章 邏輯回歸 169
一、介紹 169
二、邏輯回歸模型 170
三、評估分類性能 172
四、變量的選擇 173
五、邏輯回歸分析 175
練習題 180
第十三章 神經(jīng)網(wǎng)絡 181
一、介紹 181
二、神經(jīng)網(wǎng)絡的概念與結構 181
三、使網(wǎng)絡適應數(shù)據(jù) 182
四、必需的輸入 188
五、預測因素與結果的關系探討 189
六、神經(jīng)網(wǎng)絡的優(yōu)缺點 190
練習題 191
第十四章 判別分析 192
一、介紹 192
二、記錄與類的距離 194
三、費雪線性分類函數(shù) 195
四、判別分析的分類性能 195
五、先驗概率 196
六、不均衡的錯誤分類代價 196
七、超過兩類的分類問題 196
八、判別分析的優(yōu)勢與劣勢 198
練習題 198
第十五章 關聯(lián)規(guī)則與協(xié)同過濾 200
一、關聯(lián)規(guī)則 200
二、協(xié)同過濾 206
三、總結 212
練習題 212
第十六章 聚類分析 214
一、介紹 214
二、測量兩條記錄之間的距離 217
三、兩簇間距離測量 221
四、分層(凝聚)聚類 222
五、非層次聚類 226
練習題 228
第十七章 時間序列預測 230
一、介紹 230
二、描述性與預測性建模 231
三、商業(yè)中流行的預測方法 231
四、時間序列成分 231
五、數(shù)據(jù)分區(qū)和性能評估 234
練習題 236
第十八章 社交網(wǎng)絡分析 237
一、介紹 237
二、有向網(wǎng)絡與無向網(wǎng)絡 238
三、可視化和分析網(wǎng)絡 239
四、社交數(shù)據(jù)度量和分類 241
五、使用網(wǎng)絡指標進行預測和分類 244
六、優(yōu)點和缺點 248
練習題 249
第十九章 文本挖掘 250
一、介紹 250
二、文本的表格式表示:術語-文檔矩陣和“詞袋” 250
三、詞袋與文檔意義提取 251
四、文本預處理 252
五、實現(xiàn)數(shù)據(jù)挖掘方法 255
六、總結 258
練習題 258
第四部分 經(jīng)典商務數(shù)據(jù)分析案例
第二十章 國際應用案例 261
案例一 銀行金融營銷 261
案例二 波士頓住房 262
案例三 電腦的選擇 262
案例四 DriveTime汽車 266
案例五 寶潔公司洗衣皂 270
案例六 Studenmund餐廳 271
案例七 悉尼交通 272
案例八 ToutBay 273
案例九 查爾斯讀書俱樂部 275
案例十 德國信貸 279
案例十一 Tayko軟件目錄 283
案例十二 拒接出租車電話 287
案例十三 肥皂消費者細分 288
案例十四 交叉銷售 290
案例十五 預測破產(chǎn) 291
第二十一章 國內應用案例 294
案例一 終端換機預測 294
案例二 高校本科生就業(yè)問題研究 296
案例三 國內旅游收入影響因素研究 300
案例四 航空公司客戶價值分析 301
案例五 數(shù)據(jù)分析的其他商務應用 304
參考文獻 309