注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)網(wǎng)絡(luò)與數(shù)據(jù)通信網(wǎng)絡(luò)服務(wù)R統(tǒng)計高級編程和數(shù)據(jù)模型:分析、機器學(xué)習(xí)和可視化

R統(tǒng)計高級編程和數(shù)據(jù)模型:分析、機器學(xué)習(xí)和可視化

R統(tǒng)計高級編程和數(shù)據(jù)模型:分析、機器學(xué)習(xí)和可視化

定 價:¥128.00

作 者: [美] 馬特·威利,[美] 約書亞·F.威利 著,吳文國,胡明曉 譯
出版社: 清華大學(xué)出版社
叢編項:
標(biāo) 簽: 暫缺

ISBN: 9787302557005 出版時間: 2020-07-01 包裝: 平裝
開本: 16 頁數(shù): 528 字?jǐn)?shù):  

內(nèi)容簡介

  ● 如何使用R語言進行高級數(shù)據(jù)分析,涉及的技術(shù)包括廣義線性模型、廣義可加模型、混合效應(yīng)模型、機器學(xué)習(xí)、并行處理 ● 如何使用R語言的數(shù)據(jù)可視化技術(shù)實現(xiàn)回歸,如線性回歸和高級回歸,并了解回歸樣條和可加模型 ● 如何使用R語言實現(xiàn)機器學(xué)習(xí),包含平行處理、降維、特征選取和分類 ● 如何使用R語言的多重插補技術(shù)解決數(shù)據(jù)缺失問題 ● 如何使用廣義線性可加模型實現(xiàn)普通量、二值量和計次量的輸出,如何使用自采樣法(Bootstrapping)分析不確定性 ● 學(xué)習(xí)如何對個體內(nèi)的變異性進行建模,進而捕捉個體在方法以及時間穩(wěn)定性上的差異

作者簡介

  Matt Wiley數(shù)學(xué)專業(yè)終身副教授,他在數(shù)學(xué)教育和學(xué)生培養(yǎng)方面獲得過許多獎項。Matt在加州大學(xué)和得克薩斯 A&M大學(xué)獲得了理論數(shù)學(xué)學(xué)位、計算機科學(xué)學(xué)位和工商管理學(xué)位。他是維多利亞學(xué)院質(zhì)量提升項目的主任,負(fù)責(zé)學(xué)院綜合評估、關(guān)鍵績效指標(biāo)管理、一鍵式報表生成器和校園師生數(shù)據(jù)咨詢等工作。他還兼職Elkhart集團有限責(zé)任公司的管理工作,是該公司的數(shù)據(jù)咨詢師。Matt在R語言、SQL、C++、Ruby、Fortran和JavaScript等語言方面具有豐富的編程經(jīng)驗。他喜歡把自己的熱情融入程序設(shè)計中,從邏輯問題求解和數(shù)據(jù)科學(xué)中找到樂趣。從董事會會議室到教室,他總是能找到合適的方法來與不同學(xué)科和不同領(lǐng)域的團隊建立起良好的合作關(guān)系,他總是能把復(fù)雜的思想和項目變得容易理解和解決。 Joshua F.Wiley莫納什大學(xué)認(rèn)知與臨床神經(jīng)科學(xué)學(xué)院和心理學(xué)學(xué)院講師,他在加州大學(xué)洛杉磯分校獲得了博士學(xué)位,并在初級保健和預(yù)防領(lǐng)域完成了博士后訓(xùn)練。Joshua研究如何用先進的量化方法理解心理因素之間的動態(tài)關(guān)系、睡眠以及其他與身心健康有關(guān)的行為。他開發(fā)或與他人共同開發(fā)了眾多R語言包,如用于建立位置尺度結(jié)構(gòu)化方程模型的varian包,能夠把R語言鏈接到商業(yè)軟件Mplus的MplusAutomation包,他還設(shè)計了許多數(shù)據(jù)分析函數(shù)和能夠加快JWileymisc處理速度的函數(shù)。譯者簡介 吳文國 溫州大學(xué)計算機科學(xué)與人工智能學(xué)院副教授、博士,從事計算機專業(yè)基礎(chǔ)課教學(xué)工作,講授C程序設(shè)計、C++程序設(shè)計、Python程序設(shè)計、數(shù)據(jù)結(jié)構(gòu)與算法等課程,研究方向是算法、數(shù)據(jù)挖掘和人工智能,他還翻譯了許多計算機專業(yè)的英文圖書。

圖書目錄

第1章  單變量數(shù)據(jù)可視化  1

1.1  分布  2

1.1.1  可視化觀測數(shù)據(jù)的分布  2

1.1.2  堆積點陣圖與直方圖  2

1.1.3  經(jīng)驗密度圖  4

1.1.4  比較觀測分布與期望分布  6

1.1.5  Q-Q圖  7

1.1.6  比較經(jīng)驗密度圖與期望分布的密度圖  10

1.1.7  其他分布的擬合  11

1.2  異常值  16

1.3  小結(jié)  23

第2章  多變量數(shù)據(jù)可視化  25

2.1  分布  25

2.2  奇異值  30

2.3  變量之間的關(guān)系  33

2.4  小結(jié)  45

第3章  GLM Ⅰ  47

3.1  概念背景  48

3.2  分類預(yù)測器和虛擬編碼  49

3.2.1  二級分類預(yù)測器  49

3.2.2  三級或三級以上的分類預(yù)測值  50

3.3  交互作用和調(diào)節(jié)效應(yīng)  52

3.4  公式接口  53

3.5  方差分析  55

3.5.1  概念背景  55

3.5.2  R語言的ANOVA函數(shù)  58

3.6  線性回歸  61

3.6.1  概念背景  61

3.6.2  R語言中的線性回歸  62

3.6.3  高性能線性回歸  76

3.7  控制混合影響  78

3.8  案例研究:多線性回歸與交互作用  86

3.9  小結(jié)  93

第4章  GLM Ⅱ  95

4.1  概念背景  96

4.1.1  Logistic回歸  96

4.1.2  計數(shù)回歸  97

4.2  R程序示例  99

4.2.1  二項Logistic回歸  99

4.2.2  有序Logistic回歸  106

4.2.3  多分類Logistic回歸  109

4.2.4  泊松回歸和負(fù)二項回歸  113

4.3  案例研究:多項Logistic回歸  119

4.4  小結(jié)  127

第5章  廣義可加模型  129

5.1  概念背景  130

5.2  R語言中的GAM模型  136

5.2.1  高斯因變量  136

5.2.2  二值因變量  159

5.2.3  無序因變量  164

5.2.4  計數(shù)因變量  168

5.3  小結(jié)  176

第6章  機器學(xué)習(xí):引言  179

6.1  訓(xùn)練數(shù)據(jù)和驗證數(shù)據(jù)  180

6.2  重采樣和交叉驗證  186

6.3  自采樣法  189

6.4  并行處理和隨機數(shù)  191

6.5  小結(jié)  198

第7章  機器學(xué)習(xí):無監(jiān)督學(xué)習(xí)  201

7.1  數(shù)據(jù)背景和探索性分析  202

7.2  k-均值聚類算法  212

7.3  層次聚類算法  223

7.4  主成分分析  235

7.5  非線性聚類分析  245

7.6  小結(jié)  246

第8章  機器學(xué)習(xí):監(jiān)督學(xué)習(xí)  249

8.1  數(shù)據(jù)準(zhǔn)備  250

8.1.1  獨熱編碼  252

8.1.2  定標(biāo)化與中心化  254

8.1.3  變換  255

8.1.4  訓(xùn)練數(shù)據(jù)與驗證數(shù)據(jù)  260

8.1.5  主成分分析  261

8.2  監(jiān)督學(xué)習(xí)模型  266

8.2.1  支持向量機  267

8.2.2  分類與回歸樹  276

8.2.3  隨機森林  282

8.2.4  隨機梯度提升  288

8.2.5  多層感知機  297

8.3  小結(jié)  318

第9章  缺失數(shù)據(jù)  321

9.1  概念背景  322

9.2  R示例  328

9.2.1  回歸模型與多重插補  332

9.2.2  多重插補與并行處理  342

9.2.3  使用隨機森林法實現(xiàn)多重插補  345

9.3  案例研究:使用RF實現(xiàn)多重插補  349

9.4  小結(jié)  360

第10章  GLMM:引言  361

10.1  多層數(shù)據(jù)  362

10.1.1  數(shù)據(jù)重整  363

10.1.2  日記研究數(shù)據(jù)集  365

10.2  描述性統(tǒng)計量  368

10.2.1  基本描述量  370

10.2.2  組內(nèi)相關(guān)系數(shù)(ICC)  376

10.3  探索與假設(shè)  379

10.3.1  分布與奇異值  379

10.3.2  時間趨勢  384

10.3.3  自相關(guān)  386

10.3.4  假設(shè)  390

10.4  小結(jié)  395

第11章  GLMM:線性  397

11.1  理論  398

11.1.1  廣義線性混合模型  398

11.1.2  術(shù)語混合效應(yīng)和多層次模型  401

11.1.3  統(tǒng)計推斷  402

11.1.4  效應(yīng)量  403

11.1.5  隨機截距模型  404

11.1.6  可視化隨機效應(yīng)  404

11.1.7  解釋隨機截距模型  409

11.1.8  隨機截距斜率模型  416

11.1.9  將截距和斜率作為因變量  420

11.2  R示例  425

11.2.1  隨機截距的線性混合模型  425

11.2.2  隨機截距和隨機斜率的線性混合模型  437

11.3  小結(jié)  453

第12章  GLMM:高級  457

12.1  概念背景  458

12.2  Logistic廣義線性混合模型  458

12.2.1  隨機截距  458

12.2.2  隨機截距和隨機斜率  463

12.3  泊松分布和負(fù)二項分布GLMM  467

12.3.1  隨機截距  467

12.3.2  隨機截距和隨機斜率  477

12.4  小結(jié)  486

第13章  建模IIV  489

13.1  概念背景  490

13.1.1  貝葉斯推斷  490

13.1.2  什么是IIV  490

13.1.3  將IIV作為預(yù)測量  495

13.1.4  軟件實現(xiàn):VARIAN  499

13.2  R程序示例  500

13.3  小結(jié)  508


本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號