注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)R語言數(shù)據(jù)分析:基礎(chǔ)、算法與實(shí)戰(zhàn)

R語言數(shù)據(jù)分析:基礎(chǔ)、算法與實(shí)戰(zhàn)

R語言數(shù)據(jù)分析:基礎(chǔ)、算法與實(shí)戰(zhàn)

定 價(jià):¥99.00

作 者: 孫玉林 編著
出版社: 化學(xué)工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787122436009 出版時(shí)間: 2023-09-01 包裝: 平裝
開本: 16開 頁數(shù): 276 字?jǐn)?shù):  

內(nèi)容簡介

  本書基于主流統(tǒng)計(jì)分析編程語言R,介紹了常用的數(shù)據(jù)分析方法及其實(shí)戰(zhàn)應(yīng)用,內(nèi)容涵蓋了R語言的使用、基于ggplot2包及其拓展包的數(shù)據(jù)可視化、數(shù)據(jù)的清洗與探索、數(shù)據(jù)分析、數(shù)據(jù)挖掘以及統(tǒng)計(jì)分析方法等。本書在講解數(shù)據(jù)分析時(shí),主要基于tidyverse系列包進(jìn)行數(shù)據(jù)整理、操作與可視化,基于tidymodels系列包進(jìn)行數(shù)據(jù)分析、統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)等算法的應(yīng)用,其它的R包用于數(shù)據(jù)分析的輔助。使用R語言時(shí),遵循更新更簡潔的編程方式。本書內(nèi)容循序漸進(jìn),講解通俗易懂,同時(shí)配套源程序和數(shù)據(jù)文件,讀者可以邊學(xué)邊實(shí)踐。本書可供從事數(shù)據(jù)分析、數(shù)據(jù)可視化、機(jī)器學(xué)習(xí)的科研及技術(shù)人員閱讀使用,也可作為高等院校中統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)等相關(guān)專業(yè)的教材。

作者簡介

  無

圖書目錄

第1章 R語言與數(shù)據(jù)分析 001
1.1 R與RStudio安裝 002
1.1.1 R語言安裝 002
1.1.2 RStudio安裝 003
1.1.3 R包安裝 005
1.2 數(shù)據(jù)分析簡介 007
1.2.1 數(shù)據(jù)分析的內(nèi)容 007
1.2.2 數(shù)據(jù)分析工作流程 010
1.2.3 什么是數(shù)據(jù)分析師 012
1.2.4 數(shù)據(jù)分析師需要的技術(shù)和知識(shí) 012
1.3 R語言與數(shù)據(jù)分析 012
1.3.1 R語言為何適合數(shù)據(jù)分析 012
1.3.2 R語言常用數(shù)據(jù)分析包 013
1.4 本章小結(jié) 016
第2章 R語言快速入門 017
2.1 向量的數(shù)據(jù)類型 018
2.1.1 數(shù)值型 018
2.1.2 邏輯值型 020
2.1.3 字符型 020
2.1.4 因子型 022
2.2 矩陣與高維數(shù)組 023
2.2.1 矩陣 023
2.2.2 高維數(shù)組 025
2.3 數(shù)據(jù)框與列表 027
2.3.1 數(shù)據(jù)框 027
2.3.2 列表 030
2.4 條件判斷與循環(huán)語句 032
2.4.1 條件判斷語句 032
2.4.2 循環(huán)語句 033
2.5 編寫自己的函數(shù) 035
2.6 本章小結(jié) 037
第3章 R語言數(shù)據(jù)管理與操作 039
3.1 數(shù)據(jù)導(dǎo)入與保存 040
3.1.1 數(shù)據(jù)導(dǎo)入 040
3.1.2 數(shù)據(jù)保存 042
3.2 處理缺失值 042
3.2.1 缺失值發(fā)現(xiàn) 043
3.2.2 缺失值填充 044
3.3 數(shù)據(jù)操作 046
3.3.1 數(shù)據(jù)并行計(jì)算 046
3.3.2 數(shù)據(jù)選擇、過濾、分組 050
3.3.3 數(shù)據(jù)融合 059
3.3.4 進(jìn)行長寬數(shù)據(jù)轉(zhuǎn)換 061
3.4 其它數(shù)據(jù)處理 062
3.4.1 lubridate包處理時(shí)間數(shù)據(jù) 062
3.4.2 stringr包處理文本數(shù)據(jù) 066
3.5 本章小結(jié) 072
第4章 R語言數(shù)據(jù)可視化 073
4.1 R語言基礎(chǔ)繪圖系統(tǒng) 074
4.1.1 基礎(chǔ)繪圖系統(tǒng)可視化基本設(shè)置 074
4.1.2 基礎(chǔ)繪圖系統(tǒng)可視化實(shí)戰(zhàn) 078
4.2 ggplot2包數(shù)據(jù)可視化 084
4.2.1 使用圖層構(gòu)建圖像 085
4.2.2 ggplot2可視化進(jìn)階 092
4.3 R語言其它數(shù)據(jù)可視化包 100
4.3.1 GGally包數(shù)據(jù)可視化 100
4.3.2 ggChernoff包數(shù)據(jù)可視化 103
4.3.3 ggTimeSeries包數(shù)據(jù)可視化 104
4.3.4 pheatmap包數(shù)據(jù)可視化 106
4.3.5 igraph包數(shù)據(jù)可視化 108
4.3.6 wordcloud包數(shù)據(jù)可視化 111
4.3.7 ComplexUpset包數(shù)據(jù)可視化 112
4.4 本章小結(jié) 114
第5章 R語言數(shù)據(jù)分析 115
5.1 相關(guān)性分析 116
5.1.1 相關(guān)系數(shù)介紹 116
5.1.2 相關(guān)系數(shù)計(jì)算與可視化分析 117
5.2 方差分析 118
5.2.1 單因素方差分析 118
5.2.2 雙因素方差分析 120
5.3 降維 123
5.3.1 常用數(shù)據(jù)降維算法 123
5.3.2 數(shù)據(jù)降維實(shí)戰(zhàn) 125
5.4 回歸分析 133
5.4.1 常用回歸算法 133
5.4.2 回歸評(píng)價(jià)指標(biāo) 135
5.4.3 數(shù)據(jù)回歸實(shí)戰(zhàn) 136
5.5 分類 147
5.5.1 常用分類算法 147
5.5.2 分類評(píng)價(jià)指標(biāo) 153
5.5.3 數(shù)據(jù)分類實(shí)戰(zhàn) 154
5.6 聚類 165
5.6.1 常用數(shù)據(jù)聚類算法 165
5.6.2 聚類評(píng)價(jià)指標(biāo) 168
5.6.3 數(shù)據(jù)聚類實(shí)戰(zhàn) 168
5.7 時(shí)間序列預(yù)測(cè) 173
5.7.1 時(shí)序預(yù)測(cè)的相關(guān)模型 173
5.7.2 時(shí)間序列預(yù)測(cè)實(shí)戰(zhàn) 176
5.8 本章小結(jié) 185
第6章 綜合案例1:中藥材鑒別 187
6.1 聚類算法鑒別藥材種類 189
6.1.1 數(shù)據(jù)探索與可視化 189
6.1.2 數(shù)據(jù)降維與特征提取 192
6.1.3 數(shù)據(jù)聚類 193
6.2 分類算法鑒別藥材的產(chǎn)地 195
6.2.1 數(shù)據(jù)導(dǎo)入與探索 195
6.2.2 選擇數(shù)據(jù)中的重要特征 197
6.2.3 鑒別藥材的產(chǎn)地 200
6.3 分類算法鑒別藥材的類別 202
6.3.1 數(shù)據(jù)導(dǎo)入與探索 202
6.3.2 數(shù)據(jù)特征降維 204
6.3.3 預(yù)測(cè)藥材的類別 205
6.4 分類算法預(yù)測(cè)藥材的產(chǎn)地 210
6.4.1 數(shù)據(jù)導(dǎo)入與探索 210
6.4.2 數(shù)據(jù)特征降維 212
6.4.3 預(yù)測(cè)藥材的產(chǎn)地 213
6.5 本章小結(jié) 220
第7章 綜合案例2:抗乳腺癌候選藥物分析 221
7.1 數(shù)據(jù)特征提取 224
7.1.1 數(shù)據(jù)可視化探索 225
7.1.2 特征選擇 228
7.2 回歸模型預(yù)測(cè)生物活性 232
7.2.1 利用隨機(jī)森林提取的特征建立回歸模型 232
7.2.2 利用Lasso回歸提取的特征建立回歸模型 235
7.3 分類模型預(yù)測(cè)二分類變量 236
7.3.1 通過遞歸特征消除提取特征建立分類模型 236
7.3.2 通過主成分降維提取特征建立分類模型 241
7.4 本章小結(jié) 244
第8章 綜合案例3:文本內(nèi)容數(shù)據(jù)分析 245
8.1 文本預(yù)處理 248
8.1.1 讀取文本數(shù)據(jù) 248
8.1.2 文本數(shù)據(jù)清洗 249
8.2 特征提取與可視化 252
8.2.1 TF特征 253
8.2.2 TF-IDF特征 254
8.2.3 詞云可視化 255
8.3 文本聚類 256
8.3.1 LDA主題模型聚類 256
8.3.2 K均值聚類 261
8.4 對(duì)文本進(jìn)行分類 264
8.4.1 基于TF-IDF特征建立分類模型 264
8.4.2 基于TF特征建立分類模型 266
8.5 中文文本數(shù)據(jù)分析 268
8.5.1 《三國演義》文本數(shù)據(jù)預(yù)處理 269
8.5.2 對(duì)文本數(shù)據(jù)探索與特征提取 270
8.5.3 建立LDA主題模型 273
8.6 本章小結(jié) 276
參考文獻(xiàn) 277

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)