注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件數(shù)據(jù)挖掘:實(shí)用機(jī)器學(xué)習(xí)工具與技術(shù)(原書第4版)

數(shù)據(jù)挖掘:實(shí)用機(jī)器學(xué)習(xí)工具與技術(shù)(原書第4版)

數(shù)據(jù)挖掘:實(shí)用機(jī)器學(xué)習(xí)工具與技術(shù)(原書第4版)

定 價(jià):¥99.00

作 者: [新西蘭] 伊恩 H.威騰(Ian H.Witten) ... 著;李川 郭立坤 彭京 蔡國(guó)強(qiáng) 任艷等譯 譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 智能科學(xué)與技術(shù)叢書
標(biāo) 簽: 暫缺

ISBN: 9787111589167 出版時(shí)間: 2018-03-01 包裝: 平裝
開本: 16開 頁(yè)數(shù): 417 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域的經(jīng)典暢銷教材,被國(guó)內(nèi)外眾多名校選用。第4版新增了關(guān)于深度學(xué)習(xí)和概率方法的重要章節(jié),同時(shí),備受歡迎的機(jī)器學(xué)習(xí)軟件Weka也再度升級(jí)。書中全面覆蓋了該領(lǐng)域的實(shí)用技術(shù),致力于幫助讀者理解不同技術(shù)的工作方式和應(yīng)用方式,從而學(xué)會(huì)在工程實(shí)踐和商業(yè)項(xiàng)目中解決真實(shí)問(wèn)題。本書適合作為高等院校相關(guān)課程的教材,同時(shí)也適合業(yè)內(nèi)技術(shù)人員閱讀參考。

作者簡(jiǎn)介

  作者:(新西蘭)伊恩H.威騰 作者:埃貝·弗蘭克 作者:馬克A.霍爾 作者:(加)克里斯多夫J.帕爾 譯者:李川 譯者:郭立坤 譯者:彭京 譯者:蔡國(guó)強(qiáng) 譯者:任艷伊恩 H.威騰(Ian H.Wittetl)新西蘭懷卡托大學(xué)計(jì)算機(jī)科學(xué)系教授,ACM會(huì)士,新西蘭皇家學(xué)會(huì)會(huì)士,曾榮獲2004年國(guó)際信息處理研究協(xié)會(huì)(1FIP)頒發(fā)的Namur獎(jiǎng)。埃貝·弗蘭克(Eibe Frarlk)新西蘭懷卡托大學(xué)計(jì)算機(jī)科學(xué)系副教授,因Weka軟件的成功而與Witten及Hall一道獲得了2005年ACM SIGKDD服務(wù)獎(jiǎng)。馬克 A.霍爾(Mark A.Hall)新西蘭懷卡托大學(xué)名譽(yù)副研究員。Weka軟件的核心開發(fā)者??死锼苟喾?J.帕爾(Christopher J.Pal)蒙特利爾工程學(xué)院副教授。研究方向包括人工智能、計(jì)算機(jī)視覺(jué)和模式識(shí)別等。

圖書目錄

目  錄
Data Mining: Practical Machine Learning Tools and Techniques, Fourth Edition
譯者序
前言
致謝
第一部分 數(shù)據(jù)挖掘基礎(chǔ)
第1章 緒論 2
1.1 數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí) 2
1.1.1 描述結(jié)構(gòu)模式 3
1.1.2 機(jī)器學(xué)習(xí) 5
1.1.3 數(shù)據(jù)挖掘 6
1.2 簡(jiǎn)單的例子:天氣問(wèn)題和其他問(wèn)題 6
1.2.1 天氣問(wèn)題 6
1.2.2 隱形眼鏡:一個(gè)理想化的問(wèn)題 8
1.2.3 鳶尾花:一個(gè)經(jīng)典的數(shù)值型數(shù)據(jù)集 9
1.2.4 CPU性能:引入數(shù)值預(yù)測(cè) 10
1.2.5 勞資協(xié)商:一個(gè)更真實(shí)的例子 11
1.2.6 大豆分類:一個(gè)經(jīng)典的機(jī)器學(xué)習(xí)的成功例子 12
1.3 應(yīng)用領(lǐng)域 14
1.3.1 Web挖掘 14
1.3.2 包含判斷的決策 15
1.3.3 圖像篩選 15
1.3.4 負(fù)載預(yù)測(cè) 16
1.3.5 診斷 17
1.3.6 市場(chǎng)和銷售 17
1.3.7 其他應(yīng)用 18
1.4 數(shù)據(jù)挖掘過(guò)程 19
1.5 機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué) 20
1.6 將泛化看作搜索 21
1.6.1 枚舉概念空間 22
1.6.2 偏差 22
1.7 數(shù)據(jù)挖掘和道德問(wèn)題 24
1.7.1 再識(shí)別 24
1.7.2 使用個(gè)人信息 25
1.7.3 其他問(wèn)題 26
1.8 拓展閱讀及參考文獻(xiàn) 26
第2章 輸入:概念、實(shí)例和屬性 29
2.1 概念 29
2.2 實(shí)例 31
2.2.1 關(guān)系 31
2.2.2 其他實(shí)例類型 34
2.3 屬性 35
2.4 輸入準(zhǔn)備 36
2.4.1 數(shù)據(jù)收集 37
2.4.2 ARFF格式 37
2.4.3 稀疏數(shù)據(jù) 39
2.4.4 屬性類型 40
2.4.5 缺失值 41
2.4.6 不正確的值 42
2.4.7 非均衡數(shù)據(jù) 42
2.4.8 了解數(shù)據(jù) 43
2.5 拓展閱讀及參考文獻(xiàn) 43
第3章 輸出:知識(shí)表達(dá) 44
3.1 表 44
3.2 線性模型 44
3.3 樹 46
3.4 規(guī)則 49
3.4.1 分類規(guī)則 49
3.4.2 關(guān)聯(lián)規(guī)則 52
3.4.3 包含例外的規(guī)則 53
3.4.4 表達(dá)能力更強(qiáng)的規(guī)則 54
3.5 基于實(shí)例的表達(dá) 56
3.6 聚類 58
3.7 拓展閱讀及參考文獻(xiàn) 59
第4章 算法:基本方法 60
4.1 推斷基本規(guī)則 60
4.2 簡(jiǎn)單概率模型 63
4.2.1 缺失值和數(shù)值屬性 65
4.2.2 用于文檔分類的樸素貝葉斯 67
4.2.3 討論 68
4.3 分治法:創(chuàng)建決策樹 69
4.3.1 計(jì)算信息量 71
4.3.2 高度分支屬性 73
4.4 覆蓋算法:建立規(guī)則 74
4.4.1 規(guī)則與樹 75
4.4.2 一個(gè)簡(jiǎn)單的覆蓋算法 76
4.4.3 規(guī)則與決策列表 79
4.5 關(guān)聯(lián)規(guī)則挖掘 79
4.5.1 項(xiàng)集 80
4.5.2 關(guān)聯(lián)規(guī)則 81
4.5.3 高效地生成規(guī)則 84
4.6 線性模型 86
4.6.1 數(shù)值預(yù)測(cè):線性回歸 86
4.6.2 線性分類:logistic回歸 87
4.6.3 使用感知機(jī)的線性分類 89
4.6.4 使用Winnow的線性分類 90
4.7 基于實(shí)例的學(xué)習(xí) 91
4.7.1 距離函數(shù) 92
4.7.2 高效尋找最近鄰 92
4.7.3 討論 96
4.8 聚類 96
4.8.1 基于距離的迭代聚類 97
4.8.2 更快的距離計(jì)算 98
4.8.3 選擇簇的個(gè)數(shù) 99
4.8.4 層次聚類 100
4.8.5 層次聚類示例 101
4.8.6 增量聚類 102
4.8.7 分類效用 104
4.8.8 討論 106
4.9 多實(shí)例學(xué)習(xí) 107
4.9.1 聚集輸入 107
4.9.2 聚集輸出 107
4.10 拓展閱讀及參考文獻(xiàn) 108
4.11 Weka實(shí)現(xiàn) 109
第5章 可信度:評(píng)估學(xué)習(xí)結(jié)果 111
5.1 訓(xùn)練和測(cè)試 111
5.2 預(yù)測(cè)性能 113
5.3 交叉驗(yàn)證 115
5.4 其他評(píng)估方法 116
5.4.1 留一交叉驗(yàn)證法 116
5.4.2 自助法 116
5.5 超參數(shù)選擇 117
5.6 數(shù)據(jù)挖掘方法比較 118
5.7 預(yù)測(cè)概率 121
5.7.1 二次損失函數(shù) 121
5.7.2 信息損失函數(shù) 122
5.7.3 討論 123
5.8 計(jì)算成本 123
5.8.1 成本敏感分類 125
5.8.2 成本敏感學(xué)習(xí) 126
5.8.3 提升圖 126
5.8.4 ROC曲線 129
5.8.5 召回率–精確率曲線 130
5.8.6 討論 131
5.8.7 成本曲線 132
5.9 評(píng)估數(shù)值預(yù)測(cè) 134
5.10 最小描述長(zhǎng)度原理 136
5.11 將MDL原理應(yīng)用于聚類 138
5.12 使用驗(yàn)證集進(jìn)行模型選擇 138
5.13 拓展閱讀及參考文獻(xiàn) 139
第二部分 高級(jí)機(jī)器學(xué)習(xí)方案
第6章 樹和規(guī)則 144
6.1 決策樹 144
6.1.1 數(shù)值屬性 144
6.1.2 缺失值 145
6.1.3 剪枝 146
6.1.4 估計(jì)誤差率 147
6.1.5 決策樹歸納法的復(fù)雜度 149
6.1.6 從決策樹到規(guī)則 150
6.1.7 C4.5:選擇和選項(xiàng) 150
6.1.8 成本–復(fù)雜度剪枝 151
6.1.9 討論 151
6.2 分類規(guī)則 152
6.2.1 選擇測(cè)試的標(biāo)準(zhǔn) 152
6.2.2 缺失值和數(shù)值屬性 153
6.2.3 生成好的規(guī)則 153
6.2.4 使用全局優(yōu)化 155
6.2.5 從局部決策樹中獲得規(guī)則 157
6.2.6 包含例外的規(guī)則 158
6.2.7 討論 160
6.3 關(guān)聯(lián)規(guī)則 161
6.3.1 建立頻繁模式樹 161
6.3.2 尋找大項(xiàng)集 163
6.3.3 討論 166
6.4 Weka 實(shí)現(xiàn) 167
第7章 基于實(shí)例的學(xué)習(xí)和線性模型的擴(kuò)展 168
7.1 基于實(shí)例的學(xué)習(xí) 168
7.1.1 減少樣本集的數(shù)量 168
7.1.2 對(duì)噪聲樣本集剪枝 169
7.1.3 屬性加權(quán) 170
7.1.4 泛化樣本集 170
7.1.5 用于泛化樣本集的距離函數(shù) 171
7.1.6 泛化的距離函數(shù) 172
7.1.7 討論 172
7.2 擴(kuò)展線性模型 173
7.2.1 最大間隔超平面 173
7.2.2 非線性類邊界

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)