注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)R數(shù)據(jù)科學(xué)

R數(shù)據(jù)科學(xué)

R數(shù)據(jù)科學(xué)

定 價(jià):¥139.00

作 者: [新西蘭] 哈德利·威克姆(Hadley Wickham) 著
出版社: 人民郵電出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書(shū)可以去


ISBN: 9787115486394 出版時(shí)間: 2018-08-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)的目標(biāo)是教會(huì)讀者使用重要的數(shù)據(jù)科學(xué)工具,從而為實(shí)施數(shù)據(jù)科學(xué)奠定堅(jiān)實(shí)的基礎(chǔ)。 讀完本書(shū)后,你將掌握R語(yǔ)言的精華,并能夠熟練使用多種工具來(lái)解決各種數(shù)據(jù)科學(xué)難題。每一章都按照這樣的順序組織內(nèi)容:先給出一些引人入勝的示例,以便你可以整體了解這一章的內(nèi)容,然后再深入細(xì)節(jié)。本書(shū)的每一節(jié)都配有習(xí)題,以幫助你實(shí)踐所學(xué)到的知識(shí)。本書(shū)適合R數(shù)據(jù)科學(xué)家閱讀

作者簡(jiǎn)介

  哈德利·威克姆(Hadley Wickham), RStudio首席科學(xué)家,統(tǒng)計(jì)學(xué)家,斯坦福大學(xué)、奧克蘭大學(xué)、萊斯大學(xué)兼職統(tǒng)計(jì)學(xué)教授。已被下載數(shù)百萬(wàn)次的ggplot2等多款知名R包的開(kāi)發(fā)者,一直致力于讓普羅大眾更容易上手?jǐn)?shù)據(jù)分析,被R社區(qū)譽(yù)為“改變了R的人”。另著有《R包開(kāi)發(fā)》等書(shū)。加勒特·格羅勒芒德(Garrett Grolemund),RStudio數(shù)據(jù)科學(xué)家,知名R培訓(xùn)師,曾受邀在Google、eBay等諸多公司講授R語(yǔ)言和數(shù)據(jù)科學(xué),在DataCamp開(kāi)授的R相關(guān)課程備受R開(kāi)發(fā)者喜愛(ài)。另著有《R語(yǔ)言入門與實(shí)踐》。譯者簡(jiǎn)介陳光欣,畢業(yè)于清華大學(xué)并留校工作,主要興趣為數(shù)據(jù)分析與數(shù)據(jù)挖掘。

圖書(shū)目錄

前言XV
第一部分探索
第1章使用ggplot2進(jìn)行數(shù)據(jù)可視化3
1.1簡(jiǎn)介3
1.2第一步4
1.2.1mpg數(shù)據(jù)框4
1.2.2創(chuàng)建ggplot圖形5
1.2.3繪圖模板5
1.2.4練習(xí)6
1.3圖形屬性映射6
1.4常見(jiàn)問(wèn)題10
1.5分面11
1.6幾何對(duì)象13
1.7統(tǒng)計(jì)變換18
1.8位置調(diào)整21
1.9坐標(biāo)系25
1.10圖形分層語(yǔ)法27
第2章工作流:基礎(chǔ)29
2.1代碼基礎(chǔ)29
2.2對(duì)象名稱30
2.3函數(shù)調(diào)用30
第3章使用dplyr進(jìn)行數(shù)據(jù)轉(zhuǎn)換33
3.1簡(jiǎn)介33
3.1.1準(zhǔn)備工作33
3.1.2nycflights1333
3.1.3dplyr基礎(chǔ)34
3.2使用filter()篩選行35
3.2.1比較運(yùn)算符36
3.2.2邏輯運(yùn)算符36
3.2.3缺失值37
3.2.4練習(xí)38
3.3使用arrange()排列行39
3.4使用select()選擇列40
3.5使用mutate()添加新變量42
3.5.1常用創(chuàng)建函數(shù)43
3.5.2練習(xí)45
3.6使用summarize()進(jìn)行分組摘要46
3.6.1使用管道組合多種操作46
3.6.2缺失值48
3.6.3計(jì)數(shù)49
3.6.4常用的摘要函數(shù)52
3.6.5按多個(gè)變量分組56
3.6.6取消分組57
3.6.7練習(xí)57
3.7分組新變量(和篩選器)58
第4章工作流:腳本60
4.1運(yùn)行代碼61
4.2RStudio自動(dòng)診斷61
第5章探索性數(shù)據(jù)分析63
5.1簡(jiǎn)介63
5.2問(wèn)題64
5.3變動(dòng)64
5.3.1對(duì)分布進(jìn)行可視化表示65
5.3.2典型值67
5.3.3異常值69
5.3.4練習(xí)70
5.4缺失值71
5.5相關(guān)變動(dòng)72
5.5.1分類變量與連續(xù)變量72
5.5.2兩個(gè)分類變量77
5.5.3兩個(gè)連續(xù)變量79
5.6模式和模型82
5.7ggplot2調(diào)用84
5.8更多學(xué)習(xí)資源85
第6章工作流:項(xiàng)目86
6.1什么是真實(shí)的86
6.2你的分析位于哪里87
6.3路徑與目錄88
6.4RStudio項(xiàng)目88
6.5小結(jié)90
第二部分?jǐn)?shù)據(jù)處理

第7章使用tibble實(shí)現(xiàn)簡(jiǎn)單數(shù)據(jù)框93
7.1簡(jiǎn)介93
7.2創(chuàng)建tibble93
7.3對(duì)比tibble與data.frame95
7.3.1打印95
7.3.2取子集96
7.4與舊代碼進(jìn)行交互96
第8章使用readr進(jìn)行數(shù)據(jù)導(dǎo)入98
8.1簡(jiǎn)介98
8.2入門98
8.2.1與R基礎(chǔ)包進(jìn)行比較100
8.2.2練習(xí)101
8.3解析向量101
8.3.1數(shù)值102
8.3.2字符串103
8.3.3因子105
8.3.4日期、日期時(shí)間與時(shí)間105
8.3.5練習(xí)107
8.4解析文件107
8.4.1策略107
8.4.2問(wèn)題108
8.4.3其他策略110
8.5寫(xiě)入文件112
8.6其他類型的數(shù)據(jù)113
第9章使用dplyr處理關(guān)系數(shù)據(jù)114
9.1簡(jiǎn)介114
9.2nycflights13115
9.3鍵117
9.4合并連接119
9.4.1理解連接120
9.4.2內(nèi)連接121
9.4.3外連接121
9.4.4重復(fù)鍵122
9.4.5定義鍵列124
9.4.6練習(xí)125
9.4.7其他實(shí)現(xiàn)方式126
9.5篩選連接127
9.6連接中的問(wèn)題129
9.7集合操作130
第10章使用stringr處理字符串131
10.1簡(jiǎn)介131
10.2字符串基礎(chǔ)131
10.2.1字符串長(zhǎng)度132
10.2.2字符串組合133
10.2.3字符串取子集133
10.2.4區(qū)域設(shè)置134
10.2.5練習(xí)134
10.3使用正則表達(dá)式進(jìn)行模式匹配135
10.3.1基礎(chǔ)匹配135
10.3.2練習(xí)136
10.3.3錨點(diǎn)136
10.3.4練習(xí)137
10.3.5字符類與字符選項(xiàng)137
10.3.6練習(xí)138
10.3.7重復(fù)138
10.3.8練習(xí)139
10.3.9分組與回溯引用140
10.3.10練習(xí)140
10.4工具140
10.4.1匹配檢測(cè)142
10.4.2練習(xí)143
10.4.3提取匹配內(nèi)容144
10.4.4練習(xí)145
10.4.5分組匹配145
10.4.6練習(xí)147
10.4.7替換匹配內(nèi)容147
10.4.8練習(xí)147
10.4.9拆分147
10.4.10練習(xí)149
10.4.11定位匹配內(nèi)容149
10.5其他類型的模式149
10.6正則表達(dá)式的其他應(yīng)用152
10.7stringi152
第11章使用forcats處理因子154
11.1簡(jiǎn)介154
11.2創(chuàng)建因子154
11.3綜合社會(huì)調(diào)查156
11.4修改因子水平157
第12章使用lubridate處理日期和時(shí)間160
12.1簡(jiǎn)介160
12.2創(chuàng)建日期或時(shí)間161
12.2.1通過(guò)字符串創(chuàng)建161
12.2.2通過(guò)各個(gè)成分創(chuàng)建162
12.2.3通過(guò)其他類型數(shù)據(jù)創(chuàng)建164
12.2.4練習(xí)165
12.3日期時(shí)間成分165
12.3.1獲取成分165
12.3.2舍入168
12.3.3設(shè)置成分168
12.3.4練習(xí)170
12.4時(shí)間間隔170
12.4.1時(shí)期170
12.4.2階段171
12.4.3區(qū)間173
12.4.4小結(jié)173
12.4.5練習(xí)174
12.5時(shí)區(qū)174
第三部分編程
第13章使用magrittr進(jìn)行管道操作179
13.1簡(jiǎn)介179
13.2管道的替代方式179
13.2.1中間步驟180
13.2.2重寫(xiě)初始對(duì)象181
13.2.3函數(shù)組合181
13.2.4使用管道182
13.3不適合使用管道的情形183
13.4magrittr中的其他工具183
第14章函數(shù)185
14.1簡(jiǎn)介185
14.2什么時(shí)候應(yīng)該使用函數(shù)186
14.3人與計(jì)算機(jī)的函數(shù)188
14.4條件執(zhí)行190
14.4.1條件191
14.4.2多重條件192
14.4.3代碼風(fēng)格192
14.4.4練習(xí)193
14.5函數(shù)參數(shù)194
14.5.1選擇參數(shù)名稱195
14.5.2檢查參數(shù)值195
14.5.3點(diǎn)點(diǎn)點(diǎn)(...)197
14.5.4惰性求值197
14.5.5練習(xí)198
14.6返回值198
14.6.1顯式返回語(yǔ)句198
14.6.2使得函數(shù)支持管道199
14.7環(huán)境200
第15章向量201
15.1簡(jiǎn)介201
15.2向量基礎(chǔ)202
15.3重要的原子向量203
15.3.1邏輯型203
15.3.2數(shù)值型203
15.3.3字符型204
15.3.4缺失值204
15.3.5練習(xí)204
15.4使用原子向量205
15.4.1強(qiáng)制轉(zhuǎn)換205
15.4.2檢驗(yàn)函數(shù)206
15.4.3標(biāo)量與循環(huán)規(guī)則206
15.4.4向量命名208
15.4.5向量取子集208
15.4.6練習(xí)209
15.5遞歸向量(列表)210
15.5.1列表可視化211
15.5.2列表取子集211
15.5.3調(diào)料列表212
15.5.4練習(xí)214
15.6特性214
15.7擴(kuò)展向量216
15.7.1因子216
15.7.2日期和日期時(shí)間216
15.7.3tibble217
15.7.4練習(xí)218
第16章使用purrr實(shí)現(xiàn)迭代219
16.1簡(jiǎn)介219
16.2for循環(huán)220
16.3for循環(huán)的變體222
16.3.1修改現(xiàn)有對(duì)象222
16.3.2循環(huán)模式223
16.3.3未知的輸出長(zhǎng)度223
16.3.4未知的序列長(zhǎng)度224
16.3.5練習(xí)225
16.4for循環(huán)與函數(shù)式編程226
16.5映射函數(shù)228
16.5.1快捷方式229
16.5.2R基礎(chǔ)包230
16.5.3練習(xí)231
16.6對(duì)操作失敗的處理231
16.7多參數(shù)映射233
16.8游走函數(shù)236
16.9for循環(huán)的其他模式237
16.9.1預(yù)測(cè)函數(shù)237
16.9.2歸約與累計(jì)238
16.9.3練習(xí)239
第四部分模型
第17章使用modelr實(shí)現(xiàn)基礎(chǔ)模型243
17.1簡(jiǎn)介243
17.2一個(gè)簡(jiǎn)單模型244
17.3模型可視化250
17.3.1預(yù)測(cè)250
17.3.2殘差252
17.3.3練習(xí)253
17.4公式和模型族254
17.4.1分類變量255
17.4.2交互項(xiàng)(連續(xù)變量與分類變量)256
17.4.3交互項(xiàng)(兩個(gè)連續(xù)變量)259
17.4.4變量轉(zhuǎn)換261
17.4.5練習(xí)264
17.5缺失值264
17.6其他模型族265
第18章模型構(gòu)建266
18.1簡(jiǎn)介266
18.2為什么質(zhì)量差的鉆石更貴267
18.2.1價(jià)格與重量268
18.2.2一個(gè)更復(fù)雜的模型271
18.2.3練習(xí)273
18.3哪些因素影響了每日航班數(shù)量273
18.3.1一周中的每一天274
18.3.2季節(jié)性星期六效應(yīng)277
18.3.3計(jì)算出的變量280
18.3.4年度時(shí)間:另一種方法281
18.3.5練習(xí)282
18.4學(xué)習(xí)更多模型知識(shí)282
第19章使用purrr和broom處理多個(gè)模型284
19.1簡(jiǎn)介284
19.2列表列285
19.3創(chuàng)建列表列286
19.3.1使用嵌套286
19.3.2使用向量化函數(shù)287
19.3.3使用多值摘要288
19.3.4使用命名列表288
19.3.5練習(xí)289
19.4簡(jiǎn)化列表列290
19.4.1列表轉(zhuǎn)換為向量290
19.4.2嵌套還原291
19.4.3練習(xí)292
19.5使用broom生成整潔數(shù)據(jù)292
第五部分溝通
第20章RMarkdown295
20.1簡(jiǎn)介295
20.2RMarkdown基礎(chǔ)295
20.3使用Markdown格式化文本298
20.4代碼段299
20.4.1代碼段名稱300
20.4.2代碼段選項(xiàng)300
20.4.3表格301
20.4.4緩存301
20.4.5全局選項(xiàng)302
20.4.6內(nèi)聯(lián)代碼303
20.4.7練習(xí)303
20.5排錯(cuò)304
20.6YAML文件頭304
20.6.1文檔參數(shù)304
20.6.2參考文獻(xiàn)與引用306
20.7更多學(xué)習(xí)資源307
第21章使用ggplot2進(jìn)行圖形化溝通308
21.1簡(jiǎn)介308
21.2標(biāo)簽309
21.3注釋311
21.4標(biāo)度316
21.4.1坐標(biāo)軸刻度與圖例項(xiàng)目316
21.4.2圖例布局318
21.4.3標(biāo)度替換320
21.4.4練習(xí)324
21.5縮放325
21.6主題326
21.7保存圖形328
21.7.1圖形大小328
21.7.2其他重要選項(xiàng)330
21.8更多學(xué)習(xí)資源330
第22章RMarkdown輸出類型331
22.1簡(jiǎn)介331
22.2輸出選項(xiàng)332
22.3文檔332
22.4筆記本333
22.5演示文稿333
22.6儀表盤334
22.7交互元素335
22.7.1htmlwidgets335
22.7.2Shiny336
22.8網(wǎng)站337
22.9其他類型338
22.10更多學(xué)習(xí)資源338
第23章RMarkdown工作流339
作者簡(jiǎn)介341

封面簡(jiǎn)介341

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)