注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡人工智能Scala機器學習:構建現(xiàn)實世界機器學習和深度學習項目

Scala機器學習:構建現(xiàn)實世界機器學習和深度學習項目

Scala機器學習:構建現(xiàn)實世界機器學習和深度學習項目

定 價:¥99.00

作 者: [德] 雷祖爾·卡里姆 著,張世勇 譯
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111635130 出版時間: 2019-11-01 包裝: 平裝
開本: 16開 頁數(shù): 字數(shù):  

內容簡介

  《Scala機器學習:構建現(xiàn)實世界機器學習和深度學習項目》通過“保險賠償程度分析”“電信客戶流失分析與預測”“基于歷史和實時數(shù)據(jù)預測高頻比特幣價格”“人口規(guī)模聚類與民族預測”“主題建模:更好地洞察大型文本”“開發(fā)基于模型的電影推薦引擎”“使用 Q-learning和Scala Play框架進行期權交易”“使用深度神經(jīng)網(wǎng)絡進行銀行電話營銷的客戶訂購評估”“使用自動編碼器和異常檢測進行欺詐分析”“使用遞歸神經(jīng)網(wǎng)絡識別人類活動”和“使用卷積神經(jīng)網(wǎng)絡進行圖像分類”等11個完整的項目,結合Spark ML、H2O、Zeppelin、DeepLearning4j和MXNet等流行機器學習庫以及一些經(jīng)典數(shù)據(jù)集為讀者介紹了機器學習項目的詳細開發(fā)流程。 《Scala機器學習:構建現(xiàn)實世界機器學習和深度學習項目》主要針對數(shù)據(jù)分析師、深度學習愛好者和開發(fā)人員,他們雖具有一定的背景知識,但是對于實際項目的開發(fā)過程接觸得不多。通過本書的學習,讀者不僅可以清楚地了解到實際項目的開發(fā)流程,而且可以對目前流行的機器學習算法、機器學習庫、經(jīng)典數(shù)據(jù)集、Scala函數(shù)式編程概念和Maven、SBT等構建工具等內容有更深入的認識,并能夠在生產(chǎn)就緒環(huán)境中開發(fā),構建和部署研究機器學習項目。

作者簡介

  本書作者Md. Rezaul Karim是德國弗勞恩霍夫應用信息技術研究所(FIT)的研究科學家,也是德國亞琛工業(yè)大學的博士。在加入FIT之前,他曾先后在韓國三星電子公司擔任首席工程師,在愛爾蘭國家大數(shù)據(jù)分析研究中心Insight擔任研究員。他在C++、Java、R、Scala和Python方面擁有多年的研發(fā)經(jīng)驗,發(fā)表了多篇關于生物信息學、大數(shù)據(jù)和深度學習的研究論文,具有Spark、Zeppelin、Hadoop、Keras、Scikit-Learn、TensorFlow、DeepLearning4j、MXNet和H2O的實際工作經(jīng)驗。

圖書目錄

譯者序

原書前言

第 1章 保險賠償程度分析 // 1 

1.1 機器學習和學習過程 //1 

1.1.1 典型的機器學習工作過程 // 2 

1.2 超參數(shù)調整和交叉驗證 //4 

1.3 分析和預測保險賠償程度 //6 

1.3.1 動機 // 6 

1.3.2 數(shù)據(jù)集的描述 // 6 

1.3.3 對數(shù)據(jù)集的探索性分析 // 6 

1.3.4 數(shù)據(jù)預處理 // 10 

1.4 LR用于預測保險索賠的嚴重性 //13 

1.4.1 使用 LR開發(fā)保險賠償嚴重性預測模型 // 14 

1.5 GBT回歸用于預測保險索賠嚴重性 //18 

1.6 使用隨機森林回歸算法提升性能 //23 

1.6.1 隨機森林用于分類和回歸 // 23 

1.7 比較分析和模型部署 //29 

1.7.1 基于 Spark的大規(guī)模數(shù)據(jù)集模型部署 // 33 

1.8 小結 //34

第 2章 電信客戶流失分析與預測 // 35 

2.1 流失分析的原理以及實現(xiàn) //35 

2.2 流失分析過程 //36 

2.2.1 數(shù)據(jù)集的描述 // 38 

2.2.2 探索性分析(EDA)和特征工程 // 38 

2.3 LR用于流失預測 //47 

2.4 用于流失預測的 SVM //52 

2.5 用于客戶流失預測的 DT //55 

2.6 用于預測客戶流失的隨機森林 //61 

2.7 選擇要部署的最佳模型 //66 

2.8 小結 //68

第 3章 基于歷史和實時數(shù)據(jù)預測高頻比特幣價格 // 69 

3.1 比特幣、加密貨幣和在線交易 //69 

3.1.1 最先進的比特幣自動交易 // 71 

3.1.2 訓練 // 72 

3.1.3 預測 // 72 

3.2 原型的高級數(shù)據(jù)管道 //73 

3.3 收集歷史和實時價格數(shù)據(jù) //74 

3.3.1 歷史數(shù)據(jù)集 // 74 

3.3.2 將歷史數(shù)據(jù)轉換為時間序列 // 75 

3.3.3 通過 Cryptocompare API處理實時數(shù)據(jù) // 77 

3.4 針對預測的模型訓練 //80 

3.5 Web服務: Scala Play //85 

3.5.1 通過 Akka Actor實現(xiàn)并發(fā) // 86 

3.5.2 Web服務工作流程 // 86 

3.6 預測價格并評估模型 //91 

3.7 使用 Scala Play框架來演示預測 //92 

3.7.1 為何選擇 RESTful架構 // 92 

3.7.2 項目結構 // 93 

3.7.3 運行 Scala Play Web應用程序 // 95 

3.8 小結 //96

第 4章 人口規(guī)模聚類與民族預測 // 99 

4.1 人口規(guī)模聚類和區(qū)域民族 //99 

4.1.1 針對遺傳變異的機器學習 // 100 

4.2 1000基因項目數(shù)據(jù)集描述 //100 

4.3 算法、工具和技術 //102 

4.3.1 H2O和 Sparkling Water // 102 

4.3.2 ADAM用于大規(guī)模基因組數(shù)據(jù)處理 // 105 

4.3.3 無監(jiān)督機器學習 // 106 4.3.4 K均值的原理 // 107 

4.3.5 用于進行地理民族預測的 DNN // 108 

4.4 配置編程環(huán)境 //110 

4.5 數(shù)據(jù)預處理和特征工程 //112 

4.5.1 模型訓練和超參數(shù)調整 // 117 

4.5.2 使用隨機森林進行民族預測 // 123 

4.6 小結 //126

第 5章 主題建模:更好地洞察大型文本 // 127 

5.1 主題建模和文本聚類 //127 

5.1.1 LDA算法的工作原理 // 129 

5.2 使用 Spark MLlib和 Stanford NLP進行主題建模 //131 

5.2.1 實現(xiàn) // 131 

5.3 其他主題模型與 LDA的可擴展性 //139 

5.4 部署經(jīng)過訓練的 LDA模型 //140 

5.5 小結 //144

第 6章 開發(fā)基于模型的電影推薦引擎 // 145 

6.1 推薦系統(tǒng) //145 

6.1.1 協(xié)同過濾方法 // 145 

6.1.2 效用矩陣 // 147 

6.2 基于 Spark的電影推薦系統(tǒng) //148 

6.2.1 針對電影相似性基于商品的協(xié)同過濾 // 148 

6.2.2 基于 Spark的模型推薦 // 153 

6.3 選擇和部署最佳模型 //161 

6.4 小結 //164

第 7章 使用 Q -learning和 Scala Play框架進行期權交易 // 165 

7.1 強化學習與監(jiān)督學習和無監(jiān)督學習 //165 

7.1.1 使用強化學習 // 166 

7.1.2 強化學習中的符號、策略和效用 // 166 

7.2 簡單 Q-learning算法實現(xiàn) //169 

7.2.1 Q-learning算法的組成部分 // 169 

7.2.2 QLearning 模型驗證 // 179 7.2.3 使用訓練模型進行預測 // 179 

7.3 使用 Q-learning開發(fā)期權交易 Web應用程序 //179 

7.3.1 問題描述 // 180 

7.3.2 實現(xiàn)期權交易 Web應用程序 // 182 

7.3.3 評估模型 // 189 

7.3.4 將期權交易應用程序封裝為 Scala Web應用程序 // 191 

7.3.5 運行和部署說明 // 197 

7.3.6 模型部署 // 199 

7.4 小結 //199

第 8章 使用深度神經(jīng)網(wǎng)絡進行銀行電話營銷的客戶訂購評估 // 200 

8.1 通過電話營銷進行客戶訂購評估 //200 

8.1.1 數(shù)據(jù)集描述 // 200 

8.1.2 安裝 Apache Zeppelin并開始使用 // 202 

8.1.3 對數(shù)據(jù)集的研究與分析 // 204 

8.1.4 數(shù)字特征統(tǒng)計 // 214 

8.1.5 實施客戶訂購評估模型 // 215 

8.1.6 超參數(shù)調整和特征選擇 // 225 

8.2 小結 //227

第 9章 使用自動編碼器和異常檢測進行欺詐分析 // 228 

9.1 異常值和異常檢測 //228 

9.2 自動編碼器和無監(jiān)督學習 //231 

9.2.1 自動編碼器的工作原理 // 231 

9.2.2 使用自動編碼器實現(xiàn)高效的數(shù)據(jù)表示 // 232 

9.3 開發(fā)欺詐分析模型 //233 

9.3.1 數(shù)據(jù)集的描述和使用線性模型 // 233 

9.3.2 問題描述 // 234 

9.3.3 準備編程環(huán)境 // 234 

9.3.4 輔助類和方法 // 254 

9.4 超參數(shù)調整和特征選擇 //255 

9.5 小結 //256 

第 10章 使用遞歸神經(jīng)網(wǎng)絡識別人類活動 // 258 

10.1 使用 RNN //258 

10.1.1 上下文信息和 RNN的體系結構 // 258 

10.1.2 RNN和長期依賴性問題 // 260 

10.1.3 LSTM網(wǎng)絡 // 261 

10.2 使用 LSTM模型識別人類活動 //263 

10.2.1 數(shù)據(jù)集的描述 // 263 

10.2.2 為 Scala設置和配置 MXNet // 264 

10.3 為 HAR實現(xiàn) LSTM模型 //266 

10.4 調整 LSTM超參數(shù)和 GRU //281 

10.5 小結 //283

第 11章 使用卷積神經(jīng)網(wǎng)絡進行圖像分類 // 284 

11.1 DNN的圖像分類和缺點 //284 

11.2 CNN架構 //285 

11.2.1 卷積運算 // 286 

11.2.2 池化層和填充操作 // 287 

11.2.3 DL4j中的卷積和子采樣操作 // 288 

11.3 使用 CNN進行大規(guī)模圖像分類 //295 

11.3.1 問題描述 // 296 

11.3.2 圖像數(shù)據(jù)集的描述 // 296 

11.3.3 整個項目的工作流程 // 297 

11.3.4 CNN圖像分類的實現(xiàn) // 298 

11.4 調整和優(yōu)化 CNN超參數(shù) //315 

11.5 小結 //316


本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號