注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)R語言數(shù)據(jù)高效處理指南

R語言數(shù)據(jù)高效處理指南

R語言數(shù)據(jù)高效處理指南

定 價(jià):¥59.00

作 者: 黃天元 著
出版社: 北京大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787301306086 出版時(shí)間: 2019-09-01 包裝: 平裝
開本: 16開 頁數(shù): 212 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  R 語言在近10 年來已經(jīng)發(fā)生了日新月異的變化,不僅在內(nèi)容上更加豐富多彩,而且在計(jì)算效率上也有了大幅的提升。它被更加廣泛地用于數(shù)據(jù)可視化、統(tǒng)計(jì)建模、機(jī)器學(xué)習(xí)等領(lǐng)域,而且還能實(shí)現(xiàn)網(wǎng)絡(luò)爬蟲、網(wǎng)絡(luò)應(yīng)用開發(fā)等功能,成為數(shù)據(jù)科學(xué)領(lǐng)域的全能型工具。R 語言在學(xué)術(shù)界的地位已經(jīng)不容置疑,在大數(shù)據(jù)時(shí)代中它是保證研究可重復(fù)性的重要工具。隨著功能的日益完善,R 語言已經(jīng)進(jìn)軍工業(yè)界,并在金融、保險(xiǎn)、醫(yī)療、生物和信息計(jì)量等不同的應(yīng)用場(chǎng)景中大放異彩,潛力不可估量?!”M管R 語言能夠?qū)崿F(xiàn)豐富多樣的實(shí)際功能和框架,但是其本質(zhì)是面向數(shù)據(jù)的,因此數(shù)據(jù)處理是R 語言核心中的核心。如果能夠掌握高效的數(shù)據(jù)操作技術(shù),就能夠在各類數(shù)據(jù)分析任務(wù)中如魚得水。本書定位即為“R 語言數(shù)據(jù)處理101”,希望R 語言的使用者能夠在較早的階段就習(xí)得基本而有效的數(shù)據(jù)處理基本技術(shù)?! 禦語言數(shù)據(jù)高效處理指南》讀者群體包括在校的大學(xué)生、數(shù)據(jù)分析從業(yè)人員和致力于更加高效地處理數(shù)據(jù)的所有的R語言使用者。盡管對(duì)數(shù)據(jù)科學(xué)、計(jì)算機(jī)編程、統(tǒng)計(jì)學(xué)有一定基礎(chǔ)會(huì)幫助理解本書的內(nèi)容,但這不是必需的,來自包括初學(xué)者在內(nèi)的各個(gè)層次的讀者群體都能從本書中有所收獲。讀者在本書中不僅能夠?qū)W到數(shù)據(jù)處理中的實(shí)用技術(shù),還能培養(yǎng)在數(shù)據(jù)分析中的探索性思維??梢宰鳛榱慊A(chǔ)學(xué)習(xí)數(shù)據(jù)分析的教程、進(jìn)階數(shù)據(jù)分析實(shí)用技巧的參考書、常備查詢的案頭工具書,以及具有一定趣味性的數(shù)據(jù)分析入門啟蒙書。

作者簡(jiǎn)介

  黃天元,復(fù)旦大學(xué)生態(tài)學(xué)博士在讀,R語言忠實(shí)愛好者。熱愛數(shù)據(jù)科學(xué)與開源工具,致力于利用數(shù)據(jù)科學(xué)迅速積累行業(yè)經(jīng)驗(yàn)優(yōu)勢(shì)和科學(xué)知識(shí)發(fā)現(xiàn),涉獵內(nèi)容包括但不限于信息計(jì)量、機(jī)器學(xué)習(xí)、數(shù)據(jù)可視化、統(tǒng)計(jì)建模、知識(shí)圖譜等。已發(fā)表SCI論文兩篇,開設(shè)有知乎專欄“R語言數(shù)據(jù)挖掘”。

圖書目錄

第1 部分 基礎(chǔ)知識(shí)...................1
第1 章 數(shù)據(jù)處理總論.......................... 2
1.1 數(shù)據(jù)處理的定義 ....................2
1.2 數(shù)據(jù)處理的意義 ...................3
1.3 數(shù)據(jù)處理基本工具 ..................3
第2 章 R 語言編程基礎(chǔ).................. 6
2.1 下載安裝 ...................6
2.2 包的使用 ..................7
2.3 數(shù)據(jù)類型 .........................8
2.4 數(shù)據(jù)結(jié)構(gòu) ........................10
2.5 程序控制 ........................15
2.6 函數(shù)式編程 ....................17
第3 章 數(shù)據(jù)處理基本范式....................... 19
第2 部分 快速入門...................24
第4 章 base-r:基本數(shù)據(jù)處理................. 25
4.1 數(shù)據(jù)集及其基本探索 .....................25
4.2 基本范式實(shí)現(xiàn) ................27
4.2.1 創(chuàng)建(read.csv/data.frame) ................................27
4.2.2 刪除(rm) .........................28
4.2.3 檢索(DF[i,j]) ...................28
4.2.4 插入(rbind/cbind) ........................31
4.2.5 排序(order) .....................33
4.2.6 過濾(DF[condition,]) ...................35
4.2.7 匯總(apply) .....................36
4.2.8 分組(aggregate) ...........................36
4.2.9 連接(merge) ....................37
第5 章 tidyverse 生態(tài)系統(tǒng):簡(jiǎn)潔高效數(shù)據(jù)處理.................... 40
5.1 tidyverse 生態(tài)系統(tǒng)簡(jiǎn)介 ........................40
5.2 基本范式實(shí)現(xiàn) ............................41
5.2.1 包的加載(p_load) ........................41
5.2.2 創(chuàng)建(read_csv/tibble) ..................42
5.2.3 刪除(rm) .........................45
5.2.4 檢索(select/slice) .........................46
5.2.5 插入(add/bind) ................50
5.2.6 排序(arrange) ..................54
5.2.7 過濾(filter) ......................56
5.2.8 匯總(summarise) .........................59
5.2.9 分組(group_by) ...........................61
5.2.10 連接(join) .....................63
5.3 高級(jí)處理工具 ................67
5.3.1 長(zhǎng)寬數(shù)據(jù)變換(gather/spread) ..........................68
5.3.2 集合運(yùn)算(intersect/union/setdiff) .....................70
5.3.3 窗口函數(shù)(rank/lead/lag/cum) ...........................74
5.3.4 連接數(shù)據(jù)庫:對(duì)SQL 的支持(dbplyr) .........................81
5.3.5 巧妙寫函數(shù):變量的引用 ...............85
第3 部分 高級(jí)進(jìn)階...................93
第6 章 data.table:高速數(shù)據(jù)處理............... 94
6.1 data.table 簡(jiǎn)介 ...............94
6.2 基本范式實(shí)現(xiàn) ................96
6.3 高級(jí)特性探索 ............................... 116
第7 章 sparklyr: 分布式數(shù)據(jù)處理.................................. 128
7.1 連接R 與Spark:sparklyr 包簡(jiǎn)介 ...............................128
7.2 基本操作指南 ...............................130
7.3 存儲(chǔ)機(jī)制簡(jiǎn)介 ...............................135
7.4 分布式計(jì)算 ..................136
第4 部分 實(shí)戰(zhàn)應(yīng)用................. 139
第8 章 航班飛行數(shù)據(jù)演練..................... 140
8.1 nycflights13 數(shù)據(jù)集探索 ...........................140
8.2 flights14 數(shù)據(jù)集探索 ....................148
第9 章 測(cè)試..................... 155
第10 章 實(shí)用數(shù)據(jù)處理技巧..................... 157
10.1 數(shù)據(jù)存取 ....................157
10.1.1 令人頭疼的編碼格式(encoding) ..............................157
10.1.2 讀寫性能競(jìng)速賽(fst/feather & data.table/readr) ....................158
10.1.3 數(shù)據(jù)存取轉(zhuǎn)換的瑞士軍刀(rio) ...................162
10.2 并行計(jì)算(doParallel) .........................164
10.3 混合編程 ....................168
第11 章 實(shí)戰(zhàn)案例:網(wǎng)絡(luò)爬蟲與文本挖掘............................. 173
11.1 網(wǎng)絡(luò)爬?。╮vest) .....................174
11.2 文本挖掘(tidytext).................177
第12 章 實(shí)戰(zhàn)案例:數(shù)據(jù)塑型與可視化(ggplot2).....................180
12.1 數(shù)據(jù)準(zhǔn)備 ....................181
12.2 柱狀圖(geom_bar) .................182
12.3 折線圖(geom_line) ................183
12.4 餅圖(ggpie) ............................184
12.5 一行代碼實(shí)現(xiàn)一頁多圖(gridExtra) .......................186
第13 章 實(shí)戰(zhàn)案例:機(jī)器學(xué)習(xí).................. 193
13.1 機(jī)器學(xué)習(xí)概述 .............................193
13.2 為什么要做機(jī)器學(xué)習(xí) .................193
13.3 如何入門機(jī)器學(xué)習(xí) .....................194
13.4 數(shù)據(jù)處理與機(jī)器學(xué)習(xí) .................195
13.5 案例分析:信貸風(fēng)險(xiǎn)預(yù)測(cè)模型構(gòu)建 ...........................195
致謝..............................204

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)