定 價(jià):¥89.80
作 者: | 謝文睿,秦州,賈彬彬 著 |
出版社: | 人民郵電出版社 |
叢編項(xiàng): | |
標(biāo) 簽: | 暫缺 |
ISBN: | 9787115615725 | 出版時(shí)間: | 2023-06-01 | 包裝: | 平裝 |
開本: | 20開 | 頁數(shù): | 字?jǐn)?shù): |
序(王斌 小米AI 實(shí)驗(yàn)室主任、NLP 首席科學(xué)家)
前言
主要符號表
資源與支持
第1章 緒論 1
1.1 引言 1
1.2 基本術(shù)語 1
1.3 假設(shè)空間 5
1.4 歸納偏好 5
1.4.1 式(1.1) 和式(1.2) 的解釋 6
第2章 模型評估與選擇 8
2.1 經(jīng)驗(yàn)誤差與過擬合 8
2.2 評估方法 9
2.2.1 算法參數(shù)(超參數(shù))與模型參數(shù) 10
2.2.2 驗(yàn)證集 10
2.3 性能度量 11
2.3.1 式(2.2) ~ 式(2.7) 的解釋 11
2.3.2 式(2.8) 和式(2.9) 的解釋 11
2.3.3 圖2.3 的解釋 11
2.3.4 式(2.10) 的推導(dǎo) 11
2.3.5 式(2.11) 的解釋 12
2.3.6 式(2.12) ~ 式(2.17) 的解釋 13
2.3.7 式(2.18) 和式(2.19) 的解釋 13
2.3.8 式(2.20) 的推導(dǎo) 14
2.3.9 式(2.21) 和式(2.22) 的推導(dǎo) 16
2.3.10 式(2.23) 的解釋 18
2.3.11 式(2.24) 的解釋 19
2.3.12 式(2.25) 的解釋 20
2.4 比較檢驗(yàn) 22
2.4.1 式(2.26) 的解釋 22
2.4.2 式(2.27) 的推導(dǎo) 23
2.5 偏差與方差 26
2.5.1 式(2.37) ~ 式(2.42) 的推導(dǎo) 26
參考文獻(xiàn) 29
第3章 線性模型 30
3.1 基本形式 30
3.2 線性回歸 30
3.2.1 屬性數(shù)值化 30
3.2.2 式(3.4) 的解釋 31
3.2.3 式(3.5) 的推導(dǎo) 32
3.2.4 式(3.6) 的推導(dǎo) 32
3.2.5 式(3.7) 的推導(dǎo) 33
3.2.6 式(3.9) 的推導(dǎo) 35
3.2.7 式(3.10) 的推導(dǎo) 36
3.2.8 式(3.11) 的推導(dǎo) 36
3.3 對率回歸 39
3.3.1 式(3.27) 的推導(dǎo) 39
3.3.2 梯度下降法 41
3.3.3 牛頓法 42
3.3.4 式(3.29) 的解釋 44
3.3.5 式(3.30) 的推導(dǎo) 44
3.3.6 式(3.31) 的推導(dǎo) 45
3.4 線性判別分析 46
3.4.1 式(3.32) 的推導(dǎo) 46
3.4.2 式(3.37) ~ 式(3.39) 的推導(dǎo) 47
3.4.3 式(3.43) 的推導(dǎo) 48
3.4.4 式(3.44) 的推導(dǎo) 48
3.4.5 式(3.45) 的推導(dǎo) 49
3.5 多分類學(xué)習(xí) 52
3.5.1 圖3.5 的解釋 52
3.6 類別不平衡問題 52
參考文獻(xiàn) 52
第4章 決策樹 53
4.1 基本流程 53
4.2 劃分選擇 54
4.2.1 式(4.1) 的解釋 54
4.2.2 式(4.2) 的解釋 58
4.2.3 式(4.4) 的解釋 58
4.2.4 式(4.5) 的推導(dǎo) 59
4.2.5 式(4.6) 的解釋 59
4.3 剪枝處理 62
4.4 連續(xù)值與缺失值 63
4.4.1 式(4.7) 的解釋 63
4.4.2 式(4.8) 的解釋 64
4.4.3 式(4.12) 的解釋 64
4.5 多變量決策樹 64
4.5.1 圖4.10 的解釋 65
4.5.2 圖4.11 的解釋 65
參考文獻(xiàn) 66
第5章 神經(jīng)網(wǎng)絡(luò) 67
5.1 神經(jīng)元模型 67
5.2 感知機(jī)與多層網(wǎng)絡(luò) 67
5.2.1 式(5.1) 和式(5.2) 的推導(dǎo) 67
5.2.2 圖5.5 的解釋 70
5.3 誤差逆?zhèn)鞑ニ惴?nbsp; 70
5.3.1 式(5.10) 的推導(dǎo) 70
5.3.2 式(5.12) 的推導(dǎo) 70
5.3.3 式(5.13) 的推導(dǎo) 71
5.3.4 式(5.14) 的推導(dǎo) 72
5.3.5 式(5.15) 的推導(dǎo) 73
5.4 全局小與局部極小 73
5.5 其他常見神經(jīng)網(wǎng)絡(luò) 73
5.5.1 式(5.18) 的解釋 73
5.5.2 式(5.20) 的解釋 73
5.5.3 式(5.22) 的解釋 74
5.5.4 式(5.23) 的解釋 74
5.6 深度學(xué)習(xí) 74
5.6.1 什么是深度學(xué)習(xí) 75
5.6.2 深度學(xué)習(xí)的起源 75
5.6.3 怎么理解特征學(xué)習(xí) 75
參考文獻(xiàn) 75
第6章 支持向量機(jī) 77
6.1 間隔與支持向量 77
6.1.1 圖6.1 的解釋 77
6.1.2 式(6.1) 的解釋 77
6.1.3 式(6.2) 的推導(dǎo) 78
6.1.4 式(6.3) 的推導(dǎo) 78
6.1.5 式(6.4) 的推導(dǎo) 80
6.1.6 式(6.5) 的解釋 80
6.2 對偶問題 80
6.2.1 凸優(yōu)化問題 80
6.2.2 KKT 條件 80
6.2.3 拉格朗日對偶函數(shù) 81
6.2.4 拉格朗日對偶問題 82
6.2.5 式(6.9) 和式(6.10) 的推導(dǎo) 85
6.2.6 式(6.11) 的推導(dǎo) 85
6.2.7 式(6.13) 的解釋 86
6.3 核函數(shù) 87
6.3.1 式(6.22) 的解釋 87
6.4 軟間隔與正則化 87
6.4.1 式(6.35) 的推導(dǎo) 87
6.4.2 式(6.37) 和式(6.38) 的推導(dǎo) 87
6.4.3 式(6.39) 的推導(dǎo) 87
6.4.4 式(6.40) 的推導(dǎo) 88
6.4.5 對率回歸與支持向量機(jī)的關(guān)系 88
6.4.6 式(6.41) 的解釋 89
6.5 支持向量回歸 89
6.5.1 式(6.43) 的解釋 89
6.5.2 式(6.45) 的推導(dǎo) 90
6.5.3 式(6.52) 的推導(dǎo) 91
6.6 核方法 92
6.6.1 式(6.57) 和式(6.58) 的解釋 92
6.6.2 式(6.65) 的推導(dǎo) 92
6.6.3 式(6.66) 和式(6.67) 的解釋 93
6.6.4 式(6.70) 的推導(dǎo) 94
6.6.5 核對率回歸 98
參考文獻(xiàn) 99
第7章 貝葉斯分類器 100
7.1 貝葉斯決策論 100
7.1.1 式(7.5) 的推導(dǎo) 100
7.1.2 式(7.6) 的推導(dǎo) 100
7.1.3 判別式模型與生成式模型 100
7.2 極大似然估計(jì) 101
7.2.1 式(7.12) 和式(7.13) 的推導(dǎo) 101
7.3 樸素貝葉斯分類器 104
7.3.1 式(7.16) 和式(7.17) 的解釋 104
7.3.2 式(7.18) 的解釋 104
7.3.3 貝葉斯估計(jì) 105
7.3.4 Categorical 分布 105
7.3.5 Dirichlet 分布 106
7.3.6 式(7.19) 和式(7.20) 的推導(dǎo) 106
7.4 半樸素貝葉斯分類器 110
7.4.1 式(7.21) 的解釋 110
7.4.2 式(7.22) 的解釋 111
7.4.3 式(7.23) 的推導(dǎo) 111
7.4.4 式(7.24) 和式(7.25) 的推導(dǎo) 112
7.5 貝葉斯網(wǎng) 112
7.5.1 式(7.27) 的解釋 112
7.6 EM 算法 113
7.6.1 Jensen 不等式 113
7.6.2 EM 算法的推導(dǎo) 113
參考文獻(xiàn) 121
第8章 集成學(xué)習(xí) 122
8.1 個(gè)體與集成 123
8.1.1 式(8.1) 的解釋 123
8.1.2 式(8.2) 的解釋 123
8.1.3 式(8.3) 的推導(dǎo) 123
8.2 Boosting 124
8.2.1 式(8.4) 的解釋 125
8.2.2 式(8.5) 的解釋 125
8.2.3 式(8.6) 的推導(dǎo) 126
8.2.4 式(8.7) 的推導(dǎo) 126
8.2.5 式(8.8) 的推導(dǎo) 127
8.2.6 式(8.9) 的推導(dǎo) 127
8.2.7 式(8.10) 的解釋 128
8.2.8 式(8.11) 的推導(dǎo) 128
8.2.9 式(8.12) 的解釋 129
8.2.10 式(8.13) 的推導(dǎo) 129
8.2.11 式(8.14) 的推導(dǎo) 130
8.2.12 式(8.16) 的推導(dǎo) 131
8.2.13 式(8.17) 的推導(dǎo) 131
8.2.14 式(8.18) 的推導(dǎo) 132
8.2.15 式(8.19) 的推導(dǎo) 132
8.2.16 AdaBoost 的個(gè)人推導(dǎo) 133
8.2.17 進(jìn)一步理解權(quán)重更新公式 137
8.2.18 能夠接受帶權(quán)樣本的基學(xué)習(xí)算法 139
8.3 Bagging 與隨機(jī)森林 140
8.3.1 式(8.20) 的解釋 140
8.3.2 式(8.21) 的推導(dǎo) 140
8.3.3 隨機(jī)森林的解釋 141
8.4 結(jié)合策略 141
8.4.1 式(8.22) 的解釋 141
8.4.2 式(8.23) 的解釋 141
8.4.3 硬投票和軟投票的解釋 141
8.4.4 式(8.24) 的解釋 142
8.4.5 式(8.25) 的解釋 142
8.4.6 式(8.26) 的解釋 142
8.4.7 元學(xué)習(xí)器的解釋 142
8.4.8 Stacking 算法的解釋 143
8.5 多樣性 143
8.5.1 式(8.27) 的解釋 143
8.5.2 式(8.28) 的解釋 143
8.5.3 式(8.29) 的解釋 143
8.5.4 式(8.30) 的解釋 144
8.5.5 式(8.31) 的推導(dǎo) 144
8.5.6 式(8.32) 的解釋 144
8.5.7 式(8.33) 的解釋 145
8.5.8 式(8.34) 的解釋 145
8.5.9 式(8.35) 的解釋 145
8.5.10 式(8.36) 的解釋 145
8.5.11 式(8.40) 的解釋 145
8.5.12 式(8.41) 的解釋 146
8.5.13 式(8.42) 的解釋 146
8.5.14 多樣性增強(qiáng)的解釋 146
8.6 Gradient Boosting、GBDT、XGBoost的聯(lián)系與區(qū)別 147
8.6.1 從梯度下降的角度解釋AdaBoost 147
8.6.2 梯度提升 149
8.6.3 梯度提升樹(GBDT) 151
8.6.4 XGBoost 152
參考文獻(xiàn) 152
第9章 聚類 153
9.1 聚類任務(wù) 153
9.2 性能度量 153
9.2.1 式(9.5) 的解釋 153
9.2.2 式(9.6) 的解釋 155
9.2.3 式(9.7) 的解釋 155
9.2.4 式(9.8) 的解釋 156
9.2.5 式(9.12) 的解釋 156
9.3 距離計(jì)算 156
9.3.1 式(9.21) 的解釋 156
9.4 原型聚類 157
9.4.1 式(9.28) 的解釋 157
9.4.2 式(9.29) 的解釋 157
9.4.3 式(9.30) 的解釋 158
9.4.4 式(9.31) 的解釋 159
9.4.5 式(9.32) 的解釋 159
9.4.6 式(9.33) 的推導(dǎo) 160
9.4.7 式(9.34) 的推導(dǎo) 161
9.4.8 式(9.35) 的推導(dǎo) 162
9.4.9 式(9.36) 的解釋 164
9.4.10 式(9.37) 的推導(dǎo) 164
9.4.11 式(9.38) 的推導(dǎo) 165
9.4.12 圖9.6 的解釋 166
9.5 密度聚類 166
9.5.1 密度直達(dá)、密度可達(dá)與密度相連 167
9.5.2 圖9.9 的解釋 168
9.6 層次聚類 168
第10章 降維與度量學(xué)習(xí) 170
10.1 預(yù)備知識 170
10.1.1 符號約定 170
10.1.2 矩陣與單位陣、向量的乘法 170
10.2 矩陣的F 范數(shù)與跡 171
10.3 k 近鄰學(xué)習(xí) 173
10.3.1 式(10.1) 的解釋 173
10.3.2 式(10.2) 的推導(dǎo) 174
10.4 低維嵌入 175
10.4.1 圖10.2 的解釋 175
10.4.2 式(10.3) 的推導(dǎo) 175
10.4.3 式(10.4) 的推導(dǎo) 176
10.4.4 式(10.5) 的推導(dǎo) 177
10.4.5 式(10.6) 的推導(dǎo) 177
10.4.6 式(10.10) 的推導(dǎo) 178
10.4.7 式(10.11) 的解釋 179
10.4.8 圖10.3 關(guān)于MDS 算法的解釋 179
10.5 主成分分析 180
10.5.1 式(10.14) 的推導(dǎo) 180
10.5.2 式(10.16) 的解釋 184
10.5.3 式(10.17) 的推導(dǎo) 186
10.5.4 根據(jù)式(10.17) 求解式(10.16) 188
10.6 核化線性降維 188
10.6.1 式(10.19) 的解釋 189
10.6.2 式(10.20) 的解釋 189
10.6.3 式(10.21) 的解釋 190
10.6.4 式(10.22) 的解釋 190
10.6.5 式(10.24) 的推導(dǎo) 190
10.6.6 式(10.25) 的解釋 191
10.7 流形學(xué)習(xí) 191
10.7.1 等度量映射(Isomap) 的解釋 191
10.7.2 式(10.28) 的推導(dǎo) 192
10.7.3 式(10.31) 的推導(dǎo) 194
10.8 度量學(xué)習(xí) 196
10.8.1 式(10.34) 的解釋 196
10.8.2 式(10.35) 的解釋 197
10.8.3 式(10.36) 的解釋 197
10.8.4 式(10.37) 的解釋 198
10.8.5 式(10.38) 的解釋 198
10.8.6 式(10.39) 的解釋 198
參考文獻(xiàn) 199
第11章 特征選擇與稀疏學(xué)習(xí) 200
11.1 子集搜索與評價(jià) 200
11.1.1 式(11.1) 的解釋 200
11.1.2 式(11.2) 的解釋 200
11.2 過濾式選擇 201
11.3 包裹式選擇 201
11.4 嵌入式選擇與L1 正則化 202
11.4.1 式(11.5) 的解釋 202
11.4.2 式(11.6) 的解釋 202
11.4.3 式(11.7) 的解釋 203
11.4.4 式(11.8) 的解釋 203
11.4.5 式(11.9) 的解釋 203
11.4.6 式(11.10) 的推導(dǎo) 203
11.4.7 式(11.11) 的解釋 205
11.4.8 式(11.12) 的解釋 205
11.4.9 式(11.13) 的解釋 205
11.4.10 式(11.14) 的推導(dǎo) 205
11.5 稀疏表示與字典學(xué)習(xí) 208
11.5.1 式(11.15) 的解釋 208
11.5.2 式(11.16) 的解釋 208
11.5.3 式(11.17) 的推導(dǎo) 208
11.5.4 式(11.18) 的推導(dǎo) 208
11.6 壓縮感知 213
11.6.1 式(11.21) 的解釋 213
11.6.2 式(11.25) 的解釋 213
參考文獻(xiàn) 214
第12章 計(jì)算學(xué)習(xí)理論 215
12.1 基礎(chǔ)知識 215
12.1.1 式(12.1) 的解釋 216
12.1.2 式(12.2) 的解釋 216
12.1.3 式(12.3) 的解釋 216
12.1.4 式(12.4) 的解釋 216
12.1.5 式(12.5) 和式(12.6) 的解釋 216
12.1.6 式(12.7) 的解釋 217
12.2 PAC 學(xué)習(xí) 217
12.2.1 式(12.9) 的解釋 218
12.3 有限假設(shè)空間 218
12.3.1 式(12.10) 的解釋 219
12.3.2 式(12.11) 的解釋 219
12.3.3 式(12.12) 的推導(dǎo) 219
12.3.4 式(12.13) 的解釋 220
12.3.5 式(12.14) 的推導(dǎo) 220
12.3.6 引理12.1 的解釋 221
12.3.7 式(12.18) 的推導(dǎo) 221
12.3.8 式(12.19) 的推導(dǎo) 221
12.3.9 式(12.20) 的解釋 222
12.4 VC 維 223
12.4.1 式(12.21) 的解釋 223
12.4.2 式(12.22) 的解釋 223
12.4.3 式(12.23) 的解釋 224
12.4.4 引理12.2 的解釋 224
12.4.5 式(12.28) 的解釋 226
12.4.6 式(12.29) 的解釋 227
12.4.7 式(12.30) 的解釋 227
12.4.8 定理12.4 的解釋 228
12.5 Rademacher 復(fù)雜度 229
12.5.1 式(12.36) 的解釋 229
12.5.2 式(12.37) 的解釋 229
12.5.3 式(12.38) 的解釋 230
12.5.4 式(12.39) 的解釋 230
12.5.5 式(12.40) 的解釋 231
12.5.6 式(12.41) 的解釋 231
12.5.7 定理12.5 的解釋 231
12.6 定理12.6 的解釋 233
12.6.1 式(12.52) 的證明 235
12.6.2 式(12.53) 的推導(dǎo) 235
12.7 穩(wěn)定性 235
12.7.1 泛化損失/經(jīng)驗(yàn)損失/留一損失的解釋 236
12.7.2 式(12.57) 的解釋 236
12.7.3 定理12.8 的解釋 236
12.7.4 式(12.60) 的推導(dǎo) 237
12.7.5 經(jīng)驗(yàn)損失小化 237
12.7.6 定理12.9 的證明的解釋 237
參考文獻(xiàn) 238
第13章 半監(jiān)督學(xué)習(xí) 240
13.1 未標(biāo)記樣本 240
13.2 生成式方法 240
13.2.1 式(13.1) 的解釋 241
13.2.2 式(13.2) 的推導(dǎo) 241
13.2.3 式(13.3) 的推導(dǎo) 242
13.2.4 式(13.4) 的推導(dǎo) 242
13.2.5 式(13.5) 的解釋 242
13.2.6 式(13.6) 的解釋 243
13.2.7 式(13.7) 的解釋 244
13.2.8 式(13.8) 的解釋 246
13.3 半監(jiān)督SVM 248
13.3.1 圖13.3 的解釋 248
13.3.2 式(13.9) 的解釋 248
13.3.3 圖13.4 的解釋 248
13.3.4 式(13.10) 的解釋 250
13.4 圖半監(jiān)督學(xué)習(xí) 250
13.4.1 式(13.12) 的推導(dǎo) 251
13.4.2 式(13.13) 的推導(dǎo) 252
13.4.3 式(13.14) 的推導(dǎo) 253
13.4.4 式(13.15) 的推導(dǎo) 253
13.4.5 式(13.16) 的解釋 254
13.4.6 式(13.17) 的推導(dǎo) 254
13.4.7 式(13.18) 的解釋 254
13.4.8 式(13.20) 的解釋 254
13.4.9 式(13.21) 的推導(dǎo) 255
13.5 基于分歧的方法 259
13.5.1 圖13.6 的解釋 259
13.6 半監(jiān)督聚類 260
13.6.1 圖13.7 的解釋 260
13.6.2 圖13.9 的解釋 260
參考文獻(xiàn) 260
第14章 概率圖模型 261
14.1 隱馬爾可夫模型 261
14.1.1 生成式模型和判別式模型 261
14.1.2 式(14.1) 的推導(dǎo) 262
14.1.3 隱馬爾可夫模型的三組參數(shù) 263
14.2 馬爾可夫隨機(jī)場 263
14.2.1 式(14.2) 和式(14.3) 的解釋 263
14.2.2 式(14.4) ~ 式(14.7) 的推導(dǎo) 264
14.2.3 馬爾可夫毯 264
14.2.4 勢函數(shù) 265
14.2.5 式(14.8) 的解釋 265
14.2.6 式(14.9) 的解釋 265
14.3 條件隨機(jī)場 265
14.3.1 式(14.10) 的解釋 265
14.3.2 式(14.11) 的解釋 266
14.4 學(xué)習(xí)與推斷 266
14.4.1 式(14.14) 的推導(dǎo) 266
14.4.2 式(14.15) 和式(14.16) 的推導(dǎo) 266
14.4.3 式(14.17) 的解釋 267
14.4.4 式(14.18) 的推導(dǎo) 267
14.4.5 式(14.19) 的解釋 267
14.4.6 式(14.20) 的解釋 268
14.4.7 式(14.22) 的推導(dǎo) 268
14.4.8 圖14.8 的解釋 269
14.5 近似推斷 269
14.5.1 式(14.21) ~ 式(14.25) 的解釋 269
14.5.2 式(14.26) 的解釋 270
14.5.3 式(14.27) 的解釋 270
14.5.4 式(14.28) 的推導(dǎo) 270
14.5.5 吉布斯采樣與MH 算法 271
14.5.6 式(14.29) 的解釋 272
14.5.7 式(14.30) 的解釋 272
14.5.8 式(14.31) 的解釋 273
14.5.9 式(14.32) ~ 式(14.34) 的推導(dǎo) 273
14.5.10 式(14.35) 的解釋 274
14.5.11 式(14.36) 的推導(dǎo) 274
14.5.12 式(14.37) 和式(14.38) 的解釋 276
14.5.13 式(14.39) 的解釋 277
14.5.14 式(14.40) 的解釋 277
14.6 話題模型 278
14.6.1 式(14.41) 的解釋 278
14.6.2 式(14.42) 的解釋 279
14.6.3 式(14.43) 的解釋 279
14.6.4 式(14.44) 的解釋 279
參考文獻(xiàn) 279
第15章 規(guī)則學(xué)習(xí) 280
15.1 剪枝優(yōu)化 280
15.1.1 式(15.2) 和式(15.3) 的解釋 280
15.2 歸納邏輯程序設(shè)計(jì) 281
15.2.1 式(15.6) 的解釋 281
15.2.2 式(15.7) 的推導(dǎo) 281
15.2.3 式(15.9) 的推導(dǎo) 281
15.2.4 式(15.10) 的解釋 281
15.2.5 式(15.11) 的解釋 281
15.2.6 式(15.12) 的解釋 282
15.2.7 式(15.13) 的解釋 282
15.2.8 式(15.16) 的推導(dǎo) 282
第16章 強(qiáng)化學(xué)習(xí) 283
16.1 任務(wù)與獎(jiǎng)賞 283
16.2 K-搖臂賭博機(jī) 283
16.2.1 式(16.2) 和式(16.3) 的推導(dǎo) 283
16.2.2 式(16.4) 的解釋 283
16.3 有模型學(xué)習(xí) 284
16.3.1 式(16.7) 的解釋 284
16.3.2 式(16.8) 的推導(dǎo) 284
16.3.3 式(16.10) 的推導(dǎo) 285
16.3.4 式(16.14) 的解釋 285
16.3.5 式(16.15) 的解釋 285
16.3.6 式(16.16) 的推導(dǎo) 285
16.4 免模型學(xué)習(xí) 286
16.4.1 式(16.20) 的解釋 286
16.4.2 式(16.23) 的解釋 286
16.4.3 式(16.31) 的推導(dǎo) 286
16.5 值函數(shù)近似 287
16.5.1 式(16.33) 的解釋 287
16.5.2 式(16.34) 的推導(dǎo) 287
參考文獻(xiàn) 287