注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)工業(yè)技術(shù)建筑科學建筑設(shè)計深入淺出R語言數(shù)據(jù)分析(新時代 技術(shù)新未來)

深入淺出R語言數(shù)據(jù)分析(新時代 技術(shù)新未來)

深入淺出R語言數(shù)據(jù)分析(新時代 技術(shù)新未來)

定 價:¥69.00

作 者: 米霖 著
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

ISBN: 9787302543886 出版時間: 2020-09-01 包裝: 平裝
開本: 16開 頁數(shù): 257 字數(shù):  

內(nèi)容簡介

  《深入淺出R語言數(shù)據(jù)分析/新時代·技術(shù)新未來》首先介紹數(shù)據(jù)分析的方法論,然后介紹數(shù)據(jù)分析的相關(guān)模型方法,并進一步通過數(shù)據(jù)分析案例,講解數(shù)據(jù)分析的思維、方法及模型實現(xiàn)過程。該書重點介紹R語言在數(shù)據(jù)分析方面的應用,讓讀者能夠快速地使用R語言進行數(shù)據(jù)分析、構(gòu)建模型。全書分為17章,內(nèi)容包括:使用R語言獲取數(shù)據(jù)、數(shù)據(jù)分析中的數(shù)據(jù)處理與數(shù)據(jù)探索、生存分析、主成分分析、多維縮放、線性回歸模型、邏輯回歸模型、聚類模型、關(guān)聯(lián)規(guī)則、隨機森林、支持向量機、神經(jīng)網(wǎng)絡、文本挖掘、社交網(wǎng)絡分析,以及關(guān)于R語言數(shù)據(jù)分析的兩個延伸內(nèi)容:H2O機器學習和R語言爬蟲。《深入淺出R語言數(shù)據(jù)分析/新時代·技術(shù)新未來》內(nèi)容通俗易懂,案例豐富,實用性強,特別適合R語言的入門讀者和進階讀者閱讀,也適合數(shù)據(jù)分析人員、數(shù)據(jù)挖掘人員等其他數(shù)據(jù)科學從業(yè)者。另外,該書也適用于統(tǒng)計學、計算機、機器學習、數(shù)學等相關(guān)專業(yè)的本科生、研究生使用。

作者簡介

  米霖,畢業(yè)于華中農(nóng)業(yè)大學,本科數(shù)學專業(yè),研究生統(tǒng)計學專業(yè),8年R語言項目經(jīng)驗,擅長機器學習、統(tǒng)計模型。曾開發(fā)了多門R語言相關(guān)課程,課程包括“Shiny初級教程”“R包開發(fā)”“H20機器學習模型”“信用評分模型開發(fā)”“R語言文本挖掘”等,學員累計超過5000人。完成過很多數(shù)據(jù)分析項目,例如廣告虛假流量識別項目(通過虛假流量數(shù)據(jù)的挖掘幫助企業(yè)節(jié)省了上百萬元的營銷成本)、信貸中的信用評分項目、電商風控項目等。

圖書目錄

第1章 數(shù)據(jù)分析項目的流程
1.1 數(shù)據(jù)分析項目中的角色
1.2 數(shù)據(jù)分析項目的階段
1.2.1 制定目標
1.2.2 收集數(shù)據(jù)
1.2.3 數(shù)據(jù)處理和分析
1.2.4 構(gòu)建模型
1.2.5 評估模型
1.2.6 展示結(jié)果
1.2.7 部署與維護模型
1.3 總結(jié)
第2章 數(shù)據(jù)的讀取
2.1 RData數(shù)據(jù)
2.2 readr高效讀取數(shù)據(jù)
2.3 讀取Excel數(shù)據(jù)
2.4 讀取SPSS、SAS、STATA數(shù)據(jù)
2.5 R語言操作數(shù)據(jù)庫
2.6 總結(jié)
第3章 數(shù)據(jù)探索
3.1 缺失值的識別與處理
3.1.1 缺失值的識別與描述性統(tǒng)計
3.1.2 缺失值的可視化展示
3.1.3 缺失值的處理方法
3.2 異常值
3.3 dlookr數(shù)據(jù)處理包
3.3.1 所有變量的一般性診斷
3.3.2 數(shù)值型變量的診斷
3.3.3 分類變量的診斷
3.3.4 異常值的診斷
3.3.5 創(chuàng)建診斷報告
3.3.6 數(shù)據(jù)處理
3.3.7 缺失值處理
3.3.8 異常值處理
3.3.9 數(shù)據(jù)轉(zhuǎn)換
3.3.10 數(shù)據(jù)分箱
3.3.11 創(chuàng)建數(shù)據(jù)轉(zhuǎn)換報告
3.4 數(shù)據(jù)相關(guān)性
3.5 自動化創(chuàng)建數(shù)據(jù)探索報告
3.6 總結(jié)
第4章 生存分析
4.1 生存分析的基本內(nèi)容
4.2 使用R 語言進行生存分析
4.3 非參數(shù)模型
4.3.1 使用Kaplan-Meier 方法擬合數(shù)據(jù)
4.3.2 Kaplan-Meier 方法的可視化
4.4 半?yún)?shù)模型生存分析方法
4.4.1 構(gòu)建Cox 模型
4.4.2 檢查假設(shè)
4.4.3 Coxph 模型可視化
4.4.4 預測
4.4.5 分層
4.5 參數(shù)模型
4.6 隨機生存森林模型
4.7 總結(jié)
第5章 主成分分析
5.1 概述
5.1.1 維度相關(guān)的問題
5.1.2 檢測多重共線性
5.1.3 方差膨脹因子
5.2 主成分分析詳解
5.2.1 主成分分析的定義
5.2.2 主成分分析的簡單原理
5.2.3 主成分分析的算法
5.3 使用R 語言進行主成分分析
5.3.1 主成分分析的實現(xiàn)
5.3.2 主成分分析案例
5.4 總結(jié)
第6章 多維縮放
6.1 MDS 的工作原理
6.3 MDS 的優(yōu)點
6.2 在R 語言中實現(xiàn)MDS
6.4 總結(jié)
第7章 線性回歸模型
7.1 線性回歸模型概述
7.2 在R 語言中實現(xiàn)回歸模型
7.2.1 圖形分析
7.2.2 建立線性模型
7.2.3 回歸模型的圖形診斷
7.2.4 預測模型
7.2.5 抽樣方法
7.3 總結(jié)
第8章 邏輯回歸模型
8.1 邏輯回歸的原理
8.2 在R 語言中實現(xiàn)邏輯回歸模型
8.2.1 數(shù)據(jù)探索
8.2.2 構(gòu)建邏輯回歸模型
8.2.3 邏輯回歸預測
8.2.4 邏輯回歸模型評估
8.3 總結(jié)
第9章 聚類模型
9.1 概述
9.1.1 聚類算法
9.1.2 K均值聚類的原理
9.2 在R 語言中實現(xiàn)聚類模型
9.2.1 K均值聚類
9.2.2 層次聚類
9.2.3 Medoids 聚類(PAM)
9.3 總結(jié)
第10章 關(guān)聯(lián)規(guī)則
10.1 關(guān)聯(lián)規(guī)則概述
10.2 關(guān)聯(lián)規(guī)則的基本概念
10.3 在R 語言中實現(xiàn)關(guān)聯(lián)規(guī)劃
10.3.1 訓練模型
10.3.2 模型的評估
10.3.3 提升關(guān)聯(lián)規(guī)則的效果
10.3.4 關(guān)聯(lián)規(guī)則的可視化
10.4 總結(jié)
第11章 隨機森林
11.1 隨機森林的基本概念
11.3 總結(jié)
11.2 在R 語言中實現(xiàn)隨機森林
第12章 支持向量機
12.1 概述
12.3 總結(jié)
12.2 在R語言中實現(xiàn)支持向量機
第13章 神經(jīng)網(wǎng)絡
13.2.2 評估模型效果
13.1 概述
13.2 在R 語言中實現(xiàn)神經(jīng)網(wǎng)絡
13.3 總結(jié)
13.2.1 構(gòu)建神經(jīng)網(wǎng)絡模型
第14章 文本挖掘
14.1 概述
14.2 text2vec 背景及其基本原理
14.3 DTM 與TFIDF 的原理和實現(xiàn)
14.3.1 DTM 和TFIDF 的原理
14.3.2 DTM 的實現(xiàn)
14.3.3 TFIDF 的實現(xiàn)
14.4 情感分析
14.5 LDA 主題模型及其實現(xiàn)
14.6 構(gòu)建自動問答系統(tǒng)
14.7 總結(jié)
第15章 社交網(wǎng)絡分析
15.1 社交網(wǎng)絡概述
15.2 igraph 簡介
15.2.1 準備工作
15.2.2 圖的指標計算
15.3 社交網(wǎng)絡的常見結(jié)構(gòu)
15.4 社交網(wǎng)絡分析算法
15.4.1 Girvan-Newman
15.4.2 基于傳播標簽的社區(qū)檢測
15.4.3 基于貪婪優(yōu)化模塊的社區(qū)檢測
15.4.4 自旋轉(zhuǎn)玻璃社群
15.5 微博社交群體分析
15.5.1 自旋轉(zhuǎn)玻璃社群
15.5.2 社群檢測
15.6 總結(jié)
第16章 H2O 機器學習
16.1 H2O 機器學習平臺
16.2 在R 語言中使用H2O
16.2.1 H2O 的安裝
16.2.2 案例應用
16.2.3 H2O 常用API
16.2.4 模型的通用參數(shù)
16.2.5 參數(shù)調(diào)整
16.3 H2O Flow
16.3.1 H2O Flow 的安裝
16.3.2 H2O Flow 的基本使用方法
16.4 總結(jié)
第17章 R語言爬蟲
17.1 快速爬取網(wǎng)頁數(shù)據(jù)
17.2 rvest 簡介
17.2.1 rvest API
17.2.2 rvest API 詳解
17.3 爬取BOSS 直聘數(shù)據(jù)
17.4 模擬登錄

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號