注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡數(shù)據(jù)庫數(shù)據(jù)挖掘原理(第4版)

數(shù)據(jù)挖掘原理(第4版)

數(shù)據(jù)挖掘原理(第4版)

定 價:¥118.00

作 者: 麥克斯·布拉默(Max Bramer),李曉 著
出版社: 清華大學出版社
叢編項: 計算機科學典范教材
標 簽: 暫缺

ISBN: 9787302596493 出版時間: 2022-01-01 包裝:
開本: 16開 頁數(shù): 461 字數(shù):  

內(nèi)容簡介

  本書解釋、探索了數(shù)據(jù)挖掘的主要技術(shù),可以從數(shù)據(jù)中自動提取隱式和潛在有用的信息。數(shù)據(jù)挖掘越來越多地用于商業(yè)、科學和其他應用領(lǐng)域,它側(cè)重于分類、關(guān)聯(lián)規(guī)則挖掘和聚類。書中對每個主題都進行了清晰的解釋,重點是算法而不是數(shù)學公式,并通過詳細的有效示例加以說明。本書是為沒有強數(shù)學或統(tǒng)計學背景的讀者寫的,并詳細解釋了使用的所有公式。本書適合作為本科生或研究生層次的教材,適用專業(yè)包括計算機科學、商業(yè)研究、市場營銷、人工智能、生物信息學和法醫(yī)學。為了幫助讀者自學,本書旨在幫助普通讀者理解什么是“黑盒”,這樣他們就可以有差別地使用商業(yè)數(shù)據(jù)挖掘包,高級讀者或?qū)W術(shù)研究者可以對未來該領(lǐng)域的技術(shù)進步做出貢獻。書中每一章都有實踐練習,讓讀者檢查自己的進度。附錄還包括所使用的技術(shù)術(shù)語的完整術(shù)語表。數(shù)據(jù)挖掘原理包括對流數(shù)據(jù)分類算法的介紹,包括平穩(wěn)數(shù)據(jù)(底層模型是固定的)和依賴時間的數(shù)據(jù)(底層模型不時變化)——這種現(xiàn)象稱為概念漂移。本書提供了前饋神經(jīng)網(wǎng)絡與反向傳播的詳細描述,并顯示它如何可以用于分類。

作者簡介

  麥克斯·布拉默是英國樸次茅斯大學信息技術(shù)系榮譽教授、IFIP副主席、英國計算機學會AI專家組主席。自從 “數(shù)據(jù)挖掘”“數(shù)據(jù)庫中的知識發(fā)現(xiàn)”“大數(shù)據(jù)”和“預測分析”等技術(shù)興起以來,Max積極參與了多個數(shù)據(jù)挖掘項目,尤其是與數(shù)據(jù)自動分類相關(guān)的項目。Max發(fā)表了大量技術(shù)文章,曾撰寫Research and Development in Intelligent Systems等著作。Max具有多年的本科和研究生教學經(jīng)驗。

圖書目錄

第1章 數(shù)據(jù)挖掘簡介
1.1 數(shù)據(jù)爆炸
1.2 知識發(fā)現(xiàn)
1.3 數(shù)據(jù)挖掘的應用
1.4 標簽數(shù)據(jù)和無標簽數(shù)據(jù)
1.5 監(jiān)督學習:分類
1.6 監(jiān)督學習:數(shù)值預測
1.7 無監(jiān)督學習:關(guān)聯(lián)規(guī)則
1.8 無監(jiān)督學習:聚類
第2章 用于挖掘的數(shù)據(jù)
2.1 標準制定
2.2 變量的類型
2.3 數(shù)據(jù)準備
2.4 缺失值
2.4.1 丟棄實例
2.4.2 用最頻繁值/平均值替換
2.5 減少屬性個數(shù)
2.6 數(shù)據(jù)集的UCI存儲庫
2.7 本章小結(jié)
2.8 自我評估練習
第3章 分類簡介:樸素貝葉斯和最近鄰算法
3.1 什么是分類
3.2 樸素貝葉斯分類器
3.3 最近鄰分類
3.3.1 距離測量
3.3.2 標準化
3.3.3 處理分類屬性
3.4 急切式和懶惰式學習
3.5 本章小結(jié)
3.6 自我評估練習
第4章 使用決策樹進行分類
4.1 決策規(guī)則和決策樹
4.1.1 決策樹:高爾夫示例
4.1.2 術(shù)語
4.1.3 degrees數(shù)據(jù)集
4.2 TDIDT算法
4.3 推理的類型
4.4 本章小結(jié)
4.5 自我評估練習
第5章 決策樹歸納:使用熵進行屬性選擇
5.1 屬性選擇:一個實驗
5.2 替代決策樹
5.2.1 足球/無板籃球示例
5.2.2 匿名數(shù)據(jù)集
5.3 選擇要分裂的屬性:使用熵
……
第6章 決策樹歸納:使用頻率表進行屬性選擇
第7章 估計分類器的預測精度
第8章 連續(xù)屬性
第9章 避免決策樹的過度擬合
第10章 關(guān)于熵的更多信息
第11章 歸納分類的模塊化規(guī)則
第12章 度量分類器的性能
第13章 處理大量數(shù)據(jù)
第14章 集成分類
第15章 比較分類器
第16章 關(guān)聯(lián)規(guī)則挖掘Ⅰ
第17章 關(guān)聯(lián)規(guī)則挖掘Ⅱ
第18章 關(guān)聯(lián)規(guī)則挖掘Ⅲ:頻繁模式樹
第19章 聚類
第20章 文本挖掘
第21章 分類流數(shù)據(jù)
第22章 分類流數(shù)據(jù)Ⅱ:時間權(quán)關(guān)數(shù)據(jù)
第23章 神經(jīng)網(wǎng)絡概論
附錄A 基本數(shù)學知識
附錄B 數(shù)據(jù)集
附錄C 更多信息來源
附錄D 詞匯表和符號
附錄E 自我評估練習題答案

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號