注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡人工智能機器學習實踐:數(shù)據(jù)科學應用與工作流的開發(fā)及優(yōu)化

機器學習實踐:數(shù)據(jù)科學應用與工作流的開發(fā)及優(yōu)化

機器學習實踐:數(shù)據(jù)科學應用與工作流的開發(fā)及優(yōu)化

定 價:¥99.00

作 者: [美] 安德魯·凱萊赫,亞當·凱萊赫 著,陳子墨 劉瀚文譯 譯
出版社: 機械工業(yè)出版社
叢編項: 數(shù)據(jù)科學與工程技術叢書
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111651369 出版時間: 2020-04-01 包裝: 平裝
開本: 16開 頁數(shù): 244 字數(shù):  

內容簡介

  本書以作者在BuzzFeed的工作經驗為基礎,將機器學習和計算機工程巧妙地結合在一起。第壹部分的基本原則是數(shù)據(jù)科學世界堅實的基礎;第二部分介紹現(xiàn)實問題中的常用算法,幫助讀者迅速解決實際問題,避免被數(shù)據(jù)誤導、產生結論錯誤;第三部分則著眼于工程實踐,基于工程角度突破瓶頸,讓算法能夠在現(xiàn)實條件中得以實現(xiàn)。

作者簡介

暫缺《機器學習實踐:數(shù)據(jù)科學應用與工作流的開發(fā)及優(yōu)化》作者簡介

圖書目錄

譯者序

前言
作者簡介
第一部分 框架原則
第1章 數(shù)據(jù)科學家的定位 2
1.1 引言 2
1.2 數(shù)據(jù)科學家扮演的角色 2
1.2.1 公司規(guī)模 3
1.2.2 團隊背景 3
1.2.3 職業(yè)晉升和發(fā)展 4
1.2.4 重要性 5
1.2.5 工作細分 5
1.3 結論 5
第2章 項目流程 7
2.1 引言 7
2.2 數(shù)據(jù)團隊背景 7
2.2.1 專門崗位與資源池 8
2.2.2 研究分析 8
2.2.3 原型設計 9
2.2.4 集成的工作流 10
2.3 敏捷開發(fā)與產品定位 10
2.4 結論 15
第3章 量化誤差 16
3.1 引言 16
3.2 量化測量值的誤差 16
3.3 抽樣誤差 18
3.4 誤差傳遞 20
3.5 結論 22
第4章 數(shù)據(jù)編碼與預處理 23
4.1 引言 23
4.2 簡單文本預處理 24
4.2.1 分詞 24
4.2.2 n元模型 26
4.2.3 稀疏 26
4.2.4 特征選擇 27
4.2.5 表示學習 29
4.3 信息量損失 31
4.4 結論 33
第5章 假設檢驗 34
5.1 引言 34
5.2 什么是假設 34
5.3 假設檢驗的錯誤類型 36
5.4 p值和置信區(qū)間 37
5.5 多重測試和p值操控 38
5.6 實例 39
5.7 假設檢驗的設計 40
5.8 結論 41
第6章 數(shù)據(jù)可視化 43
6.1 引言 43
6.2 數(shù)據(jù)分布和匯總統(tǒng)計 43
6.2.1 數(shù)據(jù)分布和直方圖 44
6.2.2 散點圖和熱力圖 48
6.2.3 箱線圖和誤差條 52
6.3 時間序列圖 54
6.3.1 移動統(tǒng)計 54
6.3.2 自相關 56
6.4 圖可視化 57
6.4.1 布局算法 57
6.4.2 時間復雜度 59
6.5 結論 60
第二部分 算法與架構
第7章 算法和架構簡介 62
7.1 引言 62
7.2 架構 64
7.2.1 服務 64
7.2.2 數(shù)據(jù)源 65
7.2.3 分批及在線計算 66
7.2.4 規(guī)模擴展 66
7.3 模型 67
7.3.1 訓練 68
7.3.2 預測 68
7.3.3 驗證 69
7.4 結論 70
第8章 距離度量 71
8.1 引言 71
8.2 Jaccard距離 71
8.2.1 算法 72
8.2.2 時間復雜度 73
8.2.3 內存注意事項 73
8.2.4 分布式方法 73
8.3 MinHash 74
8.3.1 假設 75
8.3.2 時空復雜度 75
8.3.3 工具 75
8.3.4 分布式方法 75
8.4 余弦相似度 76
8.4.1 復雜度 78
8.4.2 內存注意事項 78
8.4.3 分布式方法 78
8.5 馬氏距離 78
8.5.1 復雜度 79
8.5.2 內存注意事項 79
8.5.3 分布式方法 79
8.6 結論 80
第9章 回歸 81
9.1 引言 81
9.1.1 選擇模型 82
9.1.2 選擇目標函數(shù) 82
9.1.3 模型擬合 83
9.1.4 模型驗證 84
9.2 線性最小二乘 87
9.2.1 假設 88
9.2.2 復雜度 89
9.2.3 內存注意事項 89
9.2.4 工具 89
9.2.5 分布式方法 89
9.2.6 實例 90
9.3 線性回歸中的非線性回歸 97
9.4 隨機森林 100
9.4.1 決策樹 100
9.4.2 隨機森林 103
9.5 結論 106
第10章 分類和聚類 107
10.1 引言 107
10.2 邏輯回歸 108
10.2.1 假設 111
10.2.2 時間復雜度 111
10.2.3 內存注意事項 112
10.2.4 工具 112
10.3 貝葉斯推斷與樸素貝葉斯 112
10.3.1 假設 114
10.3.2 復雜度 114
10.3.3 內存注意事項 114
10.3.4 工具 114
10.4 K-Means 115
10.4.1 假設 118
10.4.2 復雜度 118
10.4.3 內存注意事項 118
10.4.4 工具 118
10.5 最大特征值 118
10.5.1 復雜度 120
10.5.2 內存注意事項 120
10.5.3 工具 120
10.6 Louvain貪心算法 120
10.6.1 假設 121
10.6.2 復雜度 121
10.6.3 內存注意事項 121
10.6.4 工具 121
10.7 最近鄰算法 121
10.7.1 假設 123
10.7.2 復雜度 123
10.7.3 內存注意事項 123
10.7.4 工具 123
10.8 結論 123
第11章 貝葉斯網(wǎng)絡 125
11.1 引言 125
11.2 因果圖、條件獨立和馬爾
 可夫 126
11.2.1 因果圖和條件獨立 126
11.2.2 穩(wěn)定性和依賴性 127
11.3 d分離和馬爾可夫性質 128
11.3.1 馬爾可夫和因式
 分解 128
11.3.2 d分離 129
11.4 貝葉斯網(wǎng)絡的因果圖 132
11.5 模型擬合 133
11.6 結論 136
第12章 降維與隱變量模型 137
12.1 引言 137
12.2 先驗 137
12.3 因子分析 139
12.4 主成分分析 140
12.4.1 復雜度 142
12.4.2 內存注意事項 142
12.4.3 工具 142
12.5 獨立成分分析 142
12.5.1 假設 145
12.5.2 復雜度 145
12.5.3 內存注意事項 146
12.5.4 工具 146
12.6 LDA主題模型 146
12.7 結論 152
第13章 因果推斷 153
13.1 引言 153
13.2 實驗 154
13.3 觀測值:一個實例 157
13.4 非因果阻斷控制法 163
13.5 機器學習估計量 167
13.5.1 重新審視G公式 167
13.5.2 實例 168
13.6 結論 172
第14章 高級機器學習 173
14.1 引言 173
14.2 優(yōu)化 173
14.3 神經網(wǎng)絡 175
14.3.1 神經網(wǎng)絡層 176
14.3.2 神經網(wǎng)絡容量 177
14.3.3 過擬合 179
14.3.4 批擬合 183
14.3.5 損失函數(shù) 183
14.4 結論 185
第三部分 瓶頸和優(yōu)化
第15章 硬件基礎 188
15.1 引

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號