對本書的贊譽
獻詞
前言
常見符號的標準用法
第0章 引言 1
從兩張圖說起 1
大數據與機器學習 4
計算 6
第 1章 不確定性 14
1.1 頻率不確定性和bootstrap方法 14
1.2 假設檢驗和錯誤發(fā)現率控制 25
1.3 貝葉斯推斷 33
第 2章 回歸 37
2.1 線性模型 37
2.2 邏輯回歸 46
2.3 偏差與似然 49
2.4 ◆回歸不確定性 53
2.5 空間和時間 56
第3章 正則化 64
3.1 樣本外預測效果 64
3.2 正則化方法 68
3.3 模型選擇 77
3.4 ◆lasso的不確定性量化 87
第4章 分類 94
4.1 最近鄰 94
4.2 概率、成本和分類 97
4.3 多元邏輯回歸 102
4.4 分布式多元回歸 106
4.5 分布式與大數據 110
第5章 實驗 114
5.1 隨機控制試驗 115
5.2 近似實驗設計 125
5.3 ◆工具變量 135
第6章 控制 143
6.1 條件可忽略性與線性處理效果 143
6.2 高維混淆變量調整 146
6.3 ◆樣本分割與正交機器學習 148
6.4 異質性處理效果 152
6.5 合成控制法 164
第7章 分解 167
7.1 聚類 167
7.2 因子模型和主成分分析 173
7.3 主成分回歸 180
7.4 偏最小二乘法 184
第8章 文本作為數據 189
8.1 分詞 190
8.2 文本回歸 194
8.3 主題模型 194
8.4 多元逆回歸 200
8.5 協同過濾 204
8.6 詞嵌入技術 206
第9章 非參數方法 209
9.1 決策樹 210
9.2 隨機森林 216
9.3 因果關系樹 224
9.4 半參數方法與高斯過程 228
第 10章 人工智能 233
10.1 什么是人工智能 233
10.2 通用機器學習 237
10.3 深度學習 240
10.4 ◆SGD 244
10.5 強化學習 248
10.6 商業(yè)環(huán)境中的人工智能 251