注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)人工智能機(jī)器學(xué)習(xí)與數(shù)據(jù)科學(xué):基于R的統(tǒng)計(jì)學(xué)習(xí)方法

機(jī)器學(xué)習(xí)與數(shù)據(jù)科學(xué):基于R的統(tǒng)計(jì)學(xué)習(xí)方法

機(jī)器學(xué)習(xí)與數(shù)據(jù)科學(xué):基于R的統(tǒng)計(jì)學(xué)習(xí)方法

定 價(jià):¥59.00

作 者: [美] Daniel,D.,Gutierrez,古鐵雷斯 著;施翊 譯
出版社: 人民郵電出版社
叢編項(xiàng):
標(biāo) 簽: 計(jì)算機(jī)?網(wǎng)絡(luò) 人工智能

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787115452405 出版時(shí)間: 2017-05-01 包裝: 平裝
開(kāi)本: 小16開(kāi) 頁(yè)數(shù): 242 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  當(dāng)前,機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)都是很重要和熱門(mén)的相關(guān)學(xué)科,需要深入地研究學(xué)習(xí)才能精通。本書(shū)試圖指導(dǎo)讀者掌握如何完成涉及機(jī)器學(xué)習(xí)的數(shù)據(jù)科學(xué)項(xiàng)目。本書(shū)將為數(shù)據(jù)科學(xué)家提供一些在統(tǒng)計(jì)學(xué)習(xí)領(lǐng)域會(huì)用到的工具和技巧,涉及數(shù)據(jù)連接、數(shù)據(jù)處理、探索性數(shù)據(jù)分析、監(jiān)督機(jī)器學(xué)習(xí)、非監(jiān)督機(jī)器學(xué)習(xí)和模型評(píng)估。本書(shū)選用的是R統(tǒng)計(jì)環(huán)境,書(shū)中所有代碼示例都是用R語(yǔ)言編寫(xiě)的,涉及眾多流行的R包和數(shù)據(jù)集。本書(shū)適合數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師、軟件開(kāi)發(fā)者以及需要了解數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)方法的科研人員閱讀參考。

作者簡(jiǎn)介

  Daniel D. Gutierrez是一位在職的數(shù)據(jù)科學(xué)家,就職于加州Santa Monica的咨詢(xún)公司AMULET Analytics。為了緊跟行業(yè)的潮流,Daniel也是insideBIGDATA.com的執(zhí)行編輯。同時(shí),他也是一位教師,為大學(xué)和大型公司開(kāi)設(shè)了數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和R方面的課程。Deniel本科畢業(yè)于UCLA,專(zhuān)業(yè)是數(shù)學(xué)和計(jì)算機(jī)科學(xué)。

圖書(shū)目錄

第1章 機(jī)器學(xué)習(xí)綜述\t1
1.1 機(jī)器學(xué)習(xí)的分類(lèi) 2
1.2 機(jī)器學(xué)習(xí)的實(shí)際案例 3
1.2.1 預(yù)測(cè)回頭客挑戰(zhàn)賽 4
1.2.2 Netflix公司 5
1.2.3 算法交易挑戰(zhàn)賽 6
1.2.4 Heritage健康獎(jiǎng) 7
1.3 機(jī)器學(xué)習(xí)的過(guò)程 10
1.4 機(jī)器學(xué)習(xí)背后的數(shù)學(xué) 15
1.5 成為一名數(shù)據(jù)科學(xué)家 16
1.6 統(tǒng)計(jì)計(jì)算的R工程 18
1.7 RStudio 19
1.8 使用R包 20
1.9 數(shù)據(jù)集 22
1.10 在生產(chǎn)中使用R 23
1.11 小結(jié) 24
第2章 連接數(shù)據(jù) 25
2.1 管理你的工作目錄 27
2.2 數(shù)據(jù)文件的種類(lèi) 28
2.3 數(shù)據(jù)的來(lái)源 28
2.4 從網(wǎng)絡(luò)中下載數(shù)據(jù)集 29
2.5 讀取CSV文件 31
2.6 讀取Excel文件 33
2.7 使用文件連接 34
2.8 讀取JSON文件 35
2.9 從網(wǎng)站中抓取數(shù)據(jù) 36
2.10 SQL數(shù)據(jù)庫(kù) 38
2.11 R中的SQL等價(jià)表述 42
2.12 讀取Twitter數(shù)據(jù) 46
2.13 從谷歌分析中讀取數(shù)據(jù) 48
2.14 寫(xiě)數(shù)據(jù) 51
2.15 小結(jié) 53
第3章 數(shù)據(jù)處理 54
3.1 特征工程 57
3.2 數(shù)據(jù)管道 59
3.3 數(shù)據(jù)采樣 60
3.4 修正變量名 60
3.5 創(chuàng)建新變量 62
3.6 數(shù)值離散化 63
3.7 日期處理 65
3.8 將類(lèi)變量二值化 67
3.9 合并數(shù)據(jù)集 68
3.10 排列數(shù)據(jù)集 70
3.11 重塑數(shù)據(jù)集 71
3.12 使用dplyr進(jìn)行數(shù)據(jù)操作 72
3.13 處理缺失數(shù)據(jù) 75
3.14 特征縮放 77
3.15 降維 78
3.16 小結(jié) 81
第4章 探索性數(shù)據(jù)分析 83
4.1 數(shù)據(jù)統(tǒng)計(jì) 84
4.2 探索性可視化 87
4.3 直方圖 88
4.4 箱形圖 89
4.5 條形圖 92
4.6 密度圖 93
4.7 散點(diǎn)圖 95
4.8 QQ圖 101
4.9 熱圖 102
4.10 缺失值的圖表 103
4.11 解釋性圖表 104
4.12 小結(jié) 106
第5章 回歸 107
5.1 一元線性回歸 108
5.2 多元線性回歸 120
5.3 多項(xiàng)式回歸 127
5.4 小結(jié) 134
第6章 分類(lèi) 136
6.1 一個(gè)簡(jiǎn)單的例子 137
6.2 邏輯回歸 139
6.3 分類(lèi)樹(shù) 143
6.4 樸素貝葉斯 147
6.5 K-最近鄰 151
6.6 支持向量機(jī) 155
6.7 神經(jīng)網(wǎng)絡(luò) 159
6.8 集成 165
6.9 隨機(jī)森林 168
6.10 梯度提升機(jī) 171
6.11 小結(jié) 174
第7章 評(píng)估模型性能 176
7.1 過(guò)擬合 177
7.2 偏差和方差 183
7.3 干擾因子 187
7.4 數(shù)據(jù)泄漏 188
7.5 測(cè)定回歸性能 190
7.6 測(cè)定分類(lèi)性能 194
7.7 交叉驗(yàn)證 197
7.8 其他機(jī)器學(xué)習(xí)診斷法 204
7.8.1 獲取更多的訓(xùn)練觀測(cè)數(shù)據(jù) 205
7.8.2 特征降維 205
7.8.3 添加新特征 205
7.8.4 添加多項(xiàng)式特征 206
7.8.5 對(duì)正則化參數(shù)進(jìn)行微調(diào) 206
7.9 小結(jié) 206
第8章 非監(jiān)督學(xué)習(xí) 208
8.1 聚類(lèi) 209
8.2 模擬聚類(lèi) 211
8.3 分級(jí)聚類(lèi) 212
8.4 K-均值聚類(lèi) 219
8.5 主成分分析 224
8.6 小結(jié) 233
術(shù)語(yǔ)表 234

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)