套路！機(jī)器學(xué)習(xí)：北美數(shù)據(jù)科學(xué)家的私房課

定　價(jià)：￥68.00

作　者：	林薈
出版社：	電子工業(yè)出版社
叢編項(xiàng)：
標(biāo)　簽：	工業(yè)技術(shù) 自動(dòng)化技術(shù)

購(gòu)買這本書可以去

ISBN：	9787121326585	出版時(shí)間：	2017-10-01	包裝：
開本：	16開	頁(yè)數(shù)：	332	字?jǐn)?shù)：

內(nèi)容簡(jiǎn)介

　　數(shù)據(jù)科學(xué)家目前是北美*熱門的職業(yè)之一，平均年薪突破10萬美元。但數(shù)據(jù)科學(xué)并不是一個(gè)低門檻的行業(yè)，除了對(duì)數(shù)學(xué)、統(tǒng)計(jì)、計(jì)算機(jī)等相關(guān)領(lǐng)域的技術(shù)要求以外，還要相關(guān)應(yīng)用領(lǐng)域的知識(shí)。本書的寫作對(duì)象是那些現(xiàn)在從事數(shù)據(jù)分析相關(guān)行業(yè)，或者之后想從事數(shù)據(jù)分析行業(yè)的人，意在為實(shí)踐者提供數(shù)據(jù)科學(xué)家這門職業(yè)的相關(guān)信息。讀者可以從閱讀中了解到數(shù)據(jù)科學(xué)能解決的問題，數(shù)據(jù)科學(xué)家需要的技能，及背后的“分析哲學(xué)”。對(duì)于新手而言，一開始就直奔艱深的理論，很容易因?yàn)槔щy而失去興趣*終放棄。因此本書倡導(dǎo)的是一種循序漸進(jìn)的啟發(fā)教學(xué)路徑，著重在于數(shù)據(jù)科學(xué)的實(shí)際應(yīng)用，讓讀者能夠重復(fù)書中的結(jié)果，學(xué)習(xí)數(shù)據(jù)分析技能*好的方式是實(shí)踐！為了平衡理論和應(yīng)用，書中包括了一些選學(xué)小節(jié)，用來介紹更多的模型數(shù)理背景或給出必要的參考資料來源。抽絲剝繭介紹技術(shù)內(nèi)核，幫助大家知其然，同時(shí)知其所以然。希望筆者在北美從事數(shù)據(jù)科學(xué)工作多年踏遍大大小小不計(jì)其數(shù)的坑換來的經(jīng)驗(yàn)，能夠幫助讀者更加順利地成為數(shù)據(jù)科學(xué)家！

作者簡(jiǎn)介

　　2013年至今任美國(guó)杜邦公司商業(yè)數(shù)據(jù)科學(xué)家。北京師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院本科，愛荷華州立大學(xué)統(tǒng)計(jì)學(xué)院碩士和博士。曾任愛荷華州立大學(xué)獸醫(yī)學(xué)院統(tǒng)計(jì)咨詢師（2009-2013）及商學(xué)院分析咨詢師（2012-2013）。當(dāng)選2017-2018美國(guó)統(tǒng)計(jì)協(xié)會(huì)市場(chǎng)營(yíng)銷統(tǒng)計(jì)項(xiàng)目主席。翻譯出版了《應(yīng)用預(yù)測(cè)建?！泛汀禦語(yǔ)言市場(chǎng)研究分析》。

圖書目錄

第1章白話數(shù)據(jù)科學(xué)1

1.1什么是數(shù)據(jù)科學(xué)3

1.2什么是數(shù)據(jù)科學(xué)家5

1.2.1數(shù)據(jù)科學(xué)家需要的技能6

1.2.2數(shù)據(jù)科學(xué)算法總結(jié)10

1.3數(shù)據(jù)科學(xué)可以解決什么問題20

1.3.1前提要求20

1.3.2問題種類22

1.4小結(jié)25

第2章數(shù)據(jù)集26

2.1服裝消費(fèi)者數(shù)據(jù)26

2.2航空公司滿意度調(diào)查33

2.3生豬疫情風(fēng)險(xiǎn)預(yù)測(cè)數(shù)據(jù)37

第3章數(shù)據(jù)分析流程41

3.1從問題到數(shù)據(jù)42

3.2從數(shù)據(jù)到信息44

3.3從信息到行動(dòng)46

第4章數(shù)據(jù)預(yù)處理47

4.1介紹47

4.2數(shù)據(jù)清理50

4.3缺失值填補(bǔ)52

4.3.1中位數(shù)或眾數(shù)填補(bǔ)53

4.3.2K—近鄰填補(bǔ)54

4.3.3裝袋樹填補(bǔ)56

4.4中心化和標(biāo)量化56

4.5有偏分布59

4.6處理離群點(diǎn)63

4.7共線性66

4.8稀疏變量70

4.9編碼名義變量71

4.10小結(jié)73

第5章數(shù)據(jù)操作75

5.1數(shù)據(jù)讀寫76

5.1.1取代傳統(tǒng)數(shù)據(jù)框的tibble對(duì)象76

5.1.2高效數(shù)據(jù)讀寫：readr包80

5.1.3數(shù)據(jù)表對(duì)象讀取83

5.2數(shù)據(jù)整合91

5.2.1base包：apply（）91

5.2.2plyr包：ddply（）函數(shù)93

5.2.3dplyr包96

5.3數(shù)據(jù)整形102

5.3.1reshape2包102

5.3.2tidyr包105

5.4小結(jié)107

第6章基礎(chǔ)建模技術(shù)109

6.1有監(jiān)督和無監(jiān)督109

6.2誤差及其來源111

6.2.1系統(tǒng)誤差和隨機(jī)誤差111

6.2.2因變量誤差117

6.2.3自變量誤差121

6.3數(shù)據(jù)劃分和再抽樣122

6.3.1劃分訓(xùn)練集和測(cè)試集123

6.3.2重抽樣131

6.4小結(jié)135

第7章模型評(píng)估度量136

7.1回歸模型評(píng)估度量136

7.2分類模型評(píng)估度量139

7.2.1Kappa統(tǒng)計(jì)量141

7.2.2ROC曲線143

7.2.3提升圖145

7.3小結(jié)146

第8章特征工程148

8.1特征構(gòu)建149

8.2特征提取152

8.2.1初步探索特征153

8.2.2主成分分析158

8.2.3探索性因子分析163

8.2.4高維標(biāo)度化167

8.2.5知識(shí)擴(kuò)展：3種降維特征提取方法的理論171

8.3特征選擇177

8.3.1過濾法178

8.3.2繞封法188

8.4小結(jié)195

第9章線性回歸及其衍生196

9.1普通線性回歸197

9.1.1最小二乘線性模型197

9.1.2回歸診斷201

9.1.3離群點(diǎn)、高杠桿點(diǎn)和強(qiáng)影響點(diǎn)204

9.2收縮方法205

9.2.1嶺回歸205

9.2.2Lasso209

9.2.3彈性網(wǎng)絡(luò)212

9.3知識(shí)擴(kuò)展：LASSO的變量選擇功能213

9.4主成分和偏最小二乘回歸215

9.5小結(jié)221

第10章廣義線性模型壓縮方法222

10.1初識(shí)GLMNET223

10.2收縮線性回歸227

10.3邏輯回歸235

10.3.1普通邏輯回歸235

10.3.2收縮邏輯回歸236

10.3.3知識(shí)擴(kuò)展：群組lasso邏輯回歸239

10.4收縮多項(xiàng)回歸243

10.5泊松收縮回歸246

10.6小結(jié)249

第11章樹模型250

11.1分裂準(zhǔn)則252

11.2樹的修剪256

11.3回歸樹和決策樹260

11.4裝袋樹268

11.5隨機(jī)森林273

11.6助推法277

11.7知識(shí)擴(kuò)展：助推法的可加模型框架283

11.8知識(shí)擴(kuò)展：助推樹的數(shù)學(xué)框架286

11.8.1數(shù)學(xué)表達(dá)286

11.8.2梯度助推數(shù)值優(yōu)化289

11.9小結(jié)290

第12章神經(jīng)網(wǎng)絡(luò)292

12.1投影尋蹤回歸（PROJECTIONPURSUITREGRESSION）293

12.2神經(jīng)網(wǎng)絡(luò)（NEURALNETWORKS）296

12.3神經(jīng)網(wǎng)絡(luò)擬合299

12.4訓(xùn)練神經(jīng)網(wǎng)絡(luò)300

12.5用CARET包訓(xùn)練神經(jīng)網(wǎng)絡(luò)302

12.6小結(jié)311

參考文獻(xiàn)312

套路！機(jī)器學(xué)習(xí)：北美數(shù)據(jù)科學(xué)家的私房課

購(gòu)買這本書可以去

內(nèi)容簡(jiǎn)介

作者簡(jiǎn)介

圖書目錄

本目錄推薦

特種機(jī)器人操作與運(yùn)維（初級(jí)）

ROS機(jī)器人設(shè)計(jì)實(shí)訓(xùn)教程

數(shù)據(jù)分析師典型面試題精講

工業(yè)機(jī)器視覺系統(tǒng)編程與應(yīng)用

工業(yè)機(jī)器人視覺技術(shù)（第2版）

傳感器與檢測(cè)技術(shù)

數(shù)據(jù)驅(qū)動(dòng)控制理論與應(yīng)用

漫畫數(shù)學(xué)簡(jiǎn)史：從計(jì)數(shù)棒到人工智…

AI我知道：AI能說外星語(yǔ)嗎

信息技術(shù)基礎(chǔ)

套路！機(jī)器學(xué)習(xí)：北美數(shù)據(jù)科學(xué)家的私房課

購(gòu)買這本書可以去

內(nèi)容簡(jiǎn)介

作者簡(jiǎn)介

圖書目錄

本目錄推薦

套路！機(jī)器學(xué)習(xí)：北美數(shù)據(jù)科學(xué)家的私房課