注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計Java機器學習

Java機器學習

Java機器學習

定 價:¥89.00

作 者: [美] 烏黛·卡馬特(Dr.,Uday,Kamath),克里希納·肖佩拉(K 著,陳瑤 陳峰 劉江一等譯 譯
出版社: 機械工業(yè)出版社
叢編項: 智能系統(tǒng)與技術(shù)叢書
標 簽: 暫缺

ISBN: 9787111609193 出版時間: 2018-10-01 包裝: 平裝
開本: 16開 頁數(shù): 321 字數(shù):  

內(nèi)容簡介

  本書涵蓋了機器學習中的經(jīng)典技術(shù),如分類、聚類、降維、離群值檢測、半監(jiān)督學習和主動學習。同時介紹了近期高深的主題,包括流數(shù)據(jù)學習、深度學習以及大數(shù)據(jù)學習的挑戰(zhàn)。每一章指定一個主題,包括通過案例研究,介紹前沿的基于Java的工具和軟件,以及完整的知識發(fā)現(xiàn)周期:數(shù)據(jù)采集、實驗設(shè)計、建模、結(jié)果及評估。每一章都是獨立的,提供了很大的使用靈活性。附帶的網(wǎng)站提供了源碼和數(shù)據(jù)。對于學生和數(shù)據(jù)分析從業(yè)員來說,這確實很難得,大家可以直接用剛學到的方法進行實驗,或者通過將這些方法應(yīng)用到真實環(huán)境中,加深對它們的理解。

作者簡介

  Uday Kamath博士是BAE系統(tǒng)應(yīng)用智能公司的首席數(shù)據(jù)科學家,專門研究可擴展機器學習,并在反洗錢(AML)、金融犯罪欺詐檢驗、網(wǎng)絡(luò)空間安全和生物信息學領(lǐng)域擁有20年的研究經(jīng)驗。Kamath博士負責BAE系統(tǒng)應(yīng)用智能公司AI部門核心產(chǎn)品的研究分析,這些產(chǎn)品涉及的領(lǐng)域有行為科學、社交網(wǎng)絡(luò)和大數(shù)據(jù)機器學習方面。在Kenneth De Jong博士的指導下,他獲得了喬治梅森大學的博士學位,他的論文研究聚焦于大數(shù)據(jù)和自動化序列挖掘的機器學習領(lǐng)域。Krishna Choppella在BAE系統(tǒng)應(yīng)用智能公司的角色是作為解決方案架構(gòu)師,構(gòu)建工具和客戶解決方案。他有20年的Java編程經(jīng)驗,主要興趣是數(shù)據(jù)科學、函數(shù)編程和分布式計算。

圖書目錄

推薦序
譯者序
前言
作者簡介
審校者簡介
第1章 機器學習回顧1
 1.1 機器學習歷史和定義2
 1.2 哪些不屬于機器學習3
 1.3 機器學習概念和術(shù)語4
 1.4 機器學習類型及其子類6
 1.5 用于機器學習的數(shù)據(jù)集8
 1.6 機器學習的應(yīng)用10
 1.7 機器學習中的實際問題10
 1.8 機器學習角色與過程11
1.8.1 角色12
1.8.2 過程12
 1.9 機器學習工具和數(shù)據(jù)集14
 1.10 小結(jié)16
第2章 監(jiān)督學習在現(xiàn)實世界中的實踐方法18
 2.1 正式描述和符號19
2.1.1 數(shù)據(jù)質(zhì)量分析20
2.1.2 描述性數(shù)據(jù)分析20
2.1.3 可視化分析20
 2.2 數(shù)據(jù)轉(zhuǎn)換與預(yù)處理21
2.2.1 特征構(gòu)造22
2.2.2 處理缺失值22
2.2.3 離群值23
2.2.4 離散化24
2.2.5 數(shù)據(jù)采樣24
2.2.6 訓練集、驗證集和測試集26
 2.3 特征關(guān)聯(lián)分析與降維28
2.3.1 特征搜索技術(shù)29
2.3.2 特征評估技術(shù)29
 2.4 模型建立32
2.4.1 線性模型32
2.4.2 非線性模型35
2.4.3 集成學習和元學習器40
 2.5 模型評價、評估和比較42
2.5.1 模型評價42
2.5.2 模型評估指標43
2.5.3 模型比較45
 2.6 Horse Colic分類案例研究47
2.6.1 業(yè)務(wù)問題48
2.6.2 機器學習映射48
2.6.3 數(shù)據(jù)分析48
2.6.4 監(jiān)督學習實驗49
2.6.5 結(jié)果、觀察和分析58
 2.7 小結(jié)60
 2.8 參考文獻61
第3章 無監(jiān)督機器學習技術(shù)63
 3.1 與監(jiān)督學習共同存在的問題63
 3.2 無監(jiān)督學習的特定問題64
 3.3 特征分析和降維64
3.3.1 符號64
3.3.2 線性方法64
3.3.3 非線性方法67
 3.4 聚類70
3.4.1 聚類算法70
3.4.2 譜聚類75
3.4.3 仿射傳播75
3.4.4 聚類的驗證和評估77
 3.5 離群值或異常值檢測79
3.5.1 離群值算法79
3.5.2 離群值評估技術(shù)85
 3.6 實際案例研究86
3.6.1 工具和軟件86
3.6.2 業(yè)務(wù)問題86
3.6.3 機器學習映射86
3.6.4 數(shù)據(jù)收集87
3.6.5 數(shù)據(jù)質(zhì)量分析87
3.6.6 數(shù)據(jù)采樣和轉(zhuǎn)換88
3.6.7 特征分析和降維88
3.6.8 聚類模型、結(jié)果和評估91
3.6.9 離群值模型、結(jié)果和評估94
 3.7 小結(jié)95
 3.8 參考文獻95
第4章 半監(jiān)督學習和主動學習98
 4.1 半監(jiān)督學習99
4.1.1 表示、符號和假設(shè)條件99
4.1.2 半監(jiān)督學習技術(shù)101
4.1.3 半監(jiān)督學習的案例研究106
 4.2 主動學習111
4.2.1 表示和符號112
4.2.2 主動學習場景112
4.2.3 主動學習方法112
4.2.4 不確定性采樣112
4.2.5 版本空間采樣113
4.2.6 數(shù)據(jù)分布采樣115
 4.3 主動學習中的案例研究116
4.3.1 工具和軟件116
4.3.2 業(yè)務(wù)問題116
4.3.3 機器學習映射116
4.3.4 數(shù)據(jù)采集117
4.3.5 數(shù)據(jù)采樣和轉(zhuǎn)換117
4.3.6 特征分析和降維117
4.3.7 模型、結(jié)果和評估117
4.3.8 主動學習結(jié)果分析121
 4.4 小結(jié)121
 4.5 參考文獻122
第5章 實時流機器學習123
 5.1 假設(shè)條件和數(shù)學符號124
 5.2 基本的流處理和計算技術(shù)124
5.2.1 流計算124
5.2.2 滑動窗口125
5.2.3 采樣126
 5.3 概念漂移和漂移探測127
5.3.1 數(shù)據(jù)管理128
5.3.2 局部內(nèi)存128
 5.4 增量監(jiān)督學習130
5.4.1 建模技術(shù)130
5.4.2 在線環(huán)境的驗證、評估和比較136
 5.5 使用聚類的增量無監(jiān)督學習138
 5.6 使用離群值檢測的無監(jiān)督學習148
5.6.1 基于分區(qū)的聚類離群值檢測148
5.6.2 基于距離的聚類離群值檢測149
 5.7 流學習案例研究151
5.7.1 工具和軟件152
5.7.2 業(yè)務(wù)問題152
5.7.3 機器學習映射152
5.7.4 數(shù)據(jù)采集153
5.7.5 數(shù)據(jù)采樣和轉(zhuǎn)換154
5.7.6 模型、結(jié)果和評估155
5.7.7 流學習結(jié)果分析158
 5.8 小結(jié)160
 5.9 參考文獻160
第6章 概率圖建模163
 6.1 回顧概率163
 6.2 圖的概念166
6.2.1 圖的結(jié)構(gòu)和屬性166
6.2.2 子圖和團167
6.2.3 路、跡和環(huán)167
 6.3 貝葉斯網(wǎng)絡(luò)168
6.3.1 表示169
6.3.2 推斷171
6.3.3 學習180
 6.4 馬爾可夫網(wǎng)絡(luò)和條件隨機場186
6.4.1 表示187
6.4.2 推斷188
6.4.3 學習189
6.4.4 條件隨機場189
 6.5 特殊網(wǎng)絡(luò)190
6.5.1 樹增強型網(wǎng)絡(luò)190
6.5.2 馬爾可夫鏈190
 6.6 工具和使用193
6.6.1 OpenMarkov193
6.6.2 Weka貝葉斯網(wǎng)絡(luò)圖形界面194
 6.7 案例研究194
6.7.1 業(yè)務(wù)問題196
6.7.2 機器學習映射196
6.7.3 數(shù)據(jù)采樣和轉(zhuǎn)換196
6.7.4 特征分析196
6.7.5 模型、結(jié)果和評估197
6.7.6 結(jié)果分析200
 6.8 小結(jié)201
 6.9 參考文獻201
第7章 深度學習203
 7.1 多層前饋神經(jīng)網(wǎng)絡(luò)203
7.1.1 輸入、神經(jīng)元、激活函數(shù)和數(shù)學符號203
7.1.2 多層神經(jīng)網(wǎng)絡(luò)204
 7.2 神經(jīng)網(wǎng)絡(luò)的局限209
 7.3 深度學習210
 7.4 案例研究231
7.4.1 工具和軟件232
7.4.2 業(yè)務(wù)問題232
7.4.3 機器學習映射233
7.4.4 數(shù)據(jù)采樣和轉(zhuǎn)換233
7.4.5 特征分析233
7.4.6 模型、結(jié)果和評估233
 7.5 小結(jié)242
 7.6 參考文獻243
第8章 文本挖掘和自然語言處理245
 8.1 NLP及其子領(lǐng)域和任務(wù)246
8.1.1 文本分類247
8.1.2 詞性標注247
8.1.3 文本聚類247
8.1.4 信息抽取和命名實體識別247
8.1.5 情感分析和觀點挖掘247
8.1.6 指代消解248
8.1.7 詞義消歧248
8.1.8 機器翻譯248
8.1.9 語義推理及推斷249
8.1.10 文本摘要249
8.1.11 自動問答249
 8.2 挖掘非結(jié)構(gòu)化數(shù)據(jù)的問題249
 8.3 文本處理和轉(zhuǎn)換250
8.3.1 文檔收集與標準化250
8.3.2 詞元化251
8.3.3 停止詞移除251
8.3.4 詞干提取或詞形還原251
8.3.5 局部/全局字典或詞匯表252
8.3.6 特征抽取/生成253
8.3.7 特征表示和相似度255
8.3.8 特征選擇和降維258
 8.4 文本挖掘主題259
8.4.1 文本分類260
8.4.2 主題建模260
8.4.3 文本聚類263
8.4.4 命名實體識別267
8.4.5 深度學習與NLP270
 8.5 工具和使用272
8.5.1 Mallet272
8.5.2 用Mallet進行主題建模273
8.5.3 業(yè)務(wù)問題274
8.5.4 機器學習映射274
8.5.5 數(shù)據(jù)采集274
8.5.6 數(shù)據(jù)采樣和轉(zhuǎn)換275
8.5.7 特征分析和降維276
8.5.8 模型、結(jié)果和評估276
8.5.9 文本處理結(jié)果分析277
 8.6 小結(jié)278
 8.7 參考文獻278
第9章 大數(shù)據(jù)機器學習:最終領(lǐng)域281
 9.1 大數(shù)據(jù)的特點283
 9.2 大數(shù)據(jù)機器學習283
 9.3 批量大數(shù)據(jù)機器學習290
 9.4 案例研究294
9.4.1 業(yè)務(wù)問題296
9.4.2 機器學習映射296
9.4.3 數(shù)據(jù)采集296
9.4.4 數(shù)據(jù)采樣和轉(zhuǎn)換296
9.4.5 使用Spark MLlib作為大數(shù)據(jù)機器學習平臺298
 9.5 實時大數(shù)據(jù)機器學習305
 9.6 機器學習的未來310
 9.7 小結(jié)310
 9.8 參考文獻311
附錄A 線性代數(shù)313
附錄B 概率論317

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號