注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)分析與數(shù)據(jù)挖掘(第2版)

數(shù)據(jù)分析與數(shù)據(jù)挖掘(第2版)

數(shù)據(jù)分析與數(shù)據(jù)挖掘(第2版)

定 價(jià):¥59.90

作 者: 喻梅,于健,王建榮,李雪威 編
出版社: 清華大學(xué)出版社
叢編項(xiàng): 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)科研究生系列教材
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787302558682 出版時(shí)間: 2020-09-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 344 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)主要介紹數(shù)據(jù)挖掘和數(shù)據(jù)分析的基本概念和方法,包括數(shù)據(jù)的基本屬性和概念、數(shù)據(jù)預(yù)處理技術(shù)、數(shù)據(jù)立方體和OLAP技術(shù)、頻繁模式挖掘、回歸分析、分類、聚類、離群點(diǎn)分析。每一部分先介紹基本概念、理論基礎(chǔ)、應(yīng)用實(shí)例、思考習(xí)題。書(shū)中涉及的模型和算法均給予了相應(yīng)的實(shí)例,便于讀者更好的理解和使用模型。

作者簡(jiǎn)介

  喻梅天津大學(xué)智能與計(jì)算學(xué)部教授,碩士生導(dǎo)師。主要從事計(jì)算機(jī)網(wǎng)絡(luò)、數(shù)據(jù)挖掘及數(shù)據(jù)庫(kù)方向的研究及教學(xué)。研究重點(diǎn)為社交網(wǎng)絡(luò)中實(shí)體社團(tuán)的發(fā)現(xiàn)及識(shí)別、影響因素及發(fā)展規(guī)律;基于親密度及影響力的微博社交興趣圈挖掘算法等。在國(guó)際會(huì)議及期刊上發(fā)表了多篇相關(guān)學(xué)術(shù)論文。擔(dān)任多個(gè)國(guó)際會(huì)議技術(shù)委員會(huì)委員,參與會(huì)議組織工作及專業(yè)技術(shù)服務(wù)。參與多部計(jì)算機(jī)教材的編寫(xiě)。

圖書(shū)目錄

第1章概述1
1.1數(shù)據(jù)分析與數(shù)據(jù)挖掘1
1.1.1數(shù)據(jù)分析1
1.1.2數(shù)據(jù)挖掘1
1.1.3數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別和聯(lián)系3
1.2分析與挖掘的數(shù)據(jù)類型3
1.3數(shù)據(jù)分析與數(shù)據(jù)挖掘的方法7
1.4數(shù)據(jù)分析與數(shù)據(jù)挖掘使用的技術(shù)8
1.5應(yīng)用場(chǎng)景及存在的問(wèn)題12
1.5.1數(shù)據(jù)分析與數(shù)據(jù)挖掘的應(yīng)用12
1.5.2存在的主要問(wèn)題13
1.6本書(shū)結(jié)構(gòu)概述14
1.7習(xí)題14
第2章數(shù)據(jù)16
2.1數(shù)據(jù)對(duì)象與屬性類別16
2.1.1屬性的定義16
2.1.2屬性的分類16
2.2數(shù)據(jù)的基本統(tǒng)計(jì)描述17
2.2.1中心趨勢(shì)度量18
2.2.2數(shù)據(jù)分散度量20
2.2.3數(shù)據(jù)的圖形顯示22
2.3數(shù)據(jù)的相似性和相異性度量26
2.3.1數(shù)據(jù)矩陣與相異性矩陣26
2.3.2標(biāo)稱屬性的鄰近性度量27
2.3.3二元屬性的鄰近性度量28
2.3.4數(shù)值屬性的相異性29
2.3.5序數(shù)屬性的鄰近性度量31
2.3.6混合類型屬性的相異性31
2.3.7余弦相似性33目錄數(shù)據(jù)分析與數(shù)據(jù)挖掘(第2版)2.4習(xí)題34
第3章數(shù)據(jù)預(yù)處理36
3.1數(shù)據(jù)預(yù)處理及任務(wù)36
3.1.1數(shù)據(jù)預(yù)處理的必要性36
3.1.2數(shù)據(jù)預(yù)處理的主要任務(wù)39
3.2數(shù)據(jù)清理40
3.2.1缺失值、噪聲和不一致數(shù)據(jù)的處理40
3.2.2數(shù)據(jù)清理方式43
3.3數(shù)據(jù)集成44
3.4數(shù)據(jù)歸約49
3.4.1直方圖49
3.4.2數(shù)據(jù)立方體聚集50
3.4.3屬性子集選擇52
3.4.4抽樣53
3.5數(shù)據(jù)變換與數(shù)據(jù)離散化54
3.5.1數(shù)據(jù)變換策略及分類54
3.5.2數(shù)據(jù)泛化54
3.5.3數(shù)據(jù)規(guī)范化55
3.5.4數(shù)據(jù)離散化56
3.6習(xí)題58
第4章數(shù)據(jù)倉(cāng)庫(kù)與聯(lián)機(jī)分析處理59
4.1數(shù)據(jù)倉(cāng)庫(kù)基本概念59
4.1.1數(shù)據(jù)倉(cāng)庫(kù)的定義59
4.1.2數(shù)據(jù)倉(cāng)庫(kù)的性質(zhì)59
4.1.3數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)60
4.1.4數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)模型61
4.2數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)62
4.2.1數(shù)據(jù)倉(cāng)庫(kù)的概念模型設(shè)計(jì)62
4.2.2數(shù)據(jù)倉(cāng)庫(kù)的邏輯模型設(shè)計(jì)65
4.2.3數(shù)據(jù)倉(cāng)庫(kù)的物理模型設(shè)計(jì)67
4.3數(shù)據(jù)倉(cāng)庫(kù)實(shí)現(xiàn)68
4.4聯(lián)機(jī)分析處理81
4.4.1OLAP簡(jiǎn)介81
4.4.2OLAP與OLTP的關(guān)系82
4.4.3典型的OLAP操作83
4.5元數(shù)據(jù)模型87
4.5.1元數(shù)據(jù)的類型88
4.5.2元數(shù)據(jù)的作用88
4.5.3元數(shù)據(jù)的使用89
4.6習(xí)題90
第5章回歸分析91
5.1回歸分析概述91
5.1.1變量間的兩類關(guān)系91
5.1.2回歸分析的步驟92
5.2一元線性回歸93
5.2.1原理分析93
5.2.2回歸方程求解及模型檢驗(yàn)93
5.2.3一元線性回歸實(shí)例96
5.2.4案例分析: 使用Weka實(shí)現(xiàn)一元線性回歸99
5.3多元線性回歸105
5.3.1原理分析105
5.3.2回歸方程求解及模型檢驗(yàn)106
5.3.3多元線性回歸實(shí)例108
5.3.4案例分析: 使用Weka實(shí)現(xiàn)多元線性回歸110
5.4多項(xiàng)式回歸113
5.4.1原理分析113
5.4.2多項(xiàng)式回歸實(shí)例114
5.4.3案例分析: 使用Excel實(shí)現(xiàn)多項(xiàng)式回歸117
5.5習(xí)題123
第6章頻繁模式挖掘125
6.1概述125
6.1.1案例分析126
6.1.2相關(guān)概念126
6.1.3先驗(yàn)性質(zhì)128
6.2Apriori算法129
6.2.1Apriori算法分析129
6.2.2案例分析: 使用Weka實(shí)現(xiàn)Apriori算法133
6.3FPgrowth算法139
6.3.1FPgrowth算法分析139
6.3.2案例分析: 使用Weka實(shí)現(xiàn)FPgrowth算法148
6.4壓縮頻繁項(xiàng)集151
6.4.1挖掘閉模式151
6.4.2挖掘極大模式152
6.5關(guān)聯(lián)模式評(píng)估152
6.5.1支持度置信度框架153
6.5.2相關(guān)性分析153
6.5.3模式評(píng)估度量155
6.6習(xí)題156
第7章分類157
7.1分類概述157
7.1.1分類的基本概念157
7.1.2分類的相關(guān)知識(shí)158
7.2決策樹(shù)162
7.2.1決策樹(shù)的基本概念162
7.2.2決策樹(shù)分類器的算法過(guò)程163
7.2.3ID3算法165
7.2.4C4.5算法172
7.2.5Weka中使用C4.5算法進(jìn)行分類預(yù)測(cè)實(shí)例177
7.2.6決策樹(shù)的剪枝184
7.3樸素貝葉斯分類185
7.3.1樸素貝葉斯學(xué)習(xí)基本原理185
7.3.2樸素貝葉斯分類過(guò)程186
7.3.3使用Weka的樸素貝葉斯分類器進(jìn)行分類實(shí)例187
7.4惰性學(xué)習(xí)法191
7.4.1k近鄰算法描述191
7.4.2k近鄰算法性能193
7.4.3使用Weka進(jìn)行k近鄰分類實(shí)例194
7.5邏輯回歸196
7.5.1邏輯回歸的基本概念196
7.5.2二項(xiàng)邏輯回歸過(guò)程197
7.5.3用Weka進(jìn)行邏輯回歸分類實(shí)例199
7.6支持向量機(jī)202
7.6.1線性可分支持向量機(jī)算法203
7.6.2線性可分支持向量機(jī)學(xué)習(xí)算法——最大間隔法207
7.6.3使用Weka進(jìn)行支持向量機(jī)分類實(shí)例208
7.7神經(jīng)網(wǎng)絡(luò)210
7.7.1神經(jīng)網(wǎng)絡(luò)的基本概念210
7.7.2BP神經(jīng)網(wǎng)絡(luò)算法過(guò)程212
7.7.3BP神經(jīng)網(wǎng)絡(luò)分類算法實(shí)例214
7.7.4使用Weka進(jìn)行神經(jīng)網(wǎng)絡(luò)分類實(shí)例216
7.8組合方法223
7.8.1組合方法概述223
7.8.2裝袋223
7.8.3提升230
7.8.4隨機(jī)森林算法234
7.9分類模型的評(píng)估248
7.9.1分類模型的評(píng)價(jià)指標(biāo)248
7.9.2交叉驗(yàn)證253
7.9.3自助法254
7.10習(xí)題255
第8章聚類257
8.1聚類概述257
8.1.1聚類的基本概念257
8.1.2聚類算法的分類258
8.2基于劃分的聚類260
8.2.1k均值算法260
8.2.2k中心點(diǎn)算法264
8.2.3使用Weka進(jìn)行基于劃分的聚類實(shí)例268
8.3基于層次的聚類273
8.3.1基于層次的聚類的基本概念273
8.3.2簇間距離度量274
8.3.3分裂層次聚類274
8.3.4凝聚層次聚類276
8.3.5BIRCH算法278
8.3.6使用Weka進(jìn)行基于層次的聚類實(shí)例282
8.4基于密度的聚類285
8.4.1基于密度的聚類的基本概念285
8.4.2DBSCAN算法286
8.4.3使用Weka進(jìn)行基于密度的聚類實(shí)例290
8.5基于網(wǎng)格的聚類293
8.5.1STING算法294
8.5.2CLIQUE算法296
8.6聚類質(zhì)量的評(píng)估299
8.7習(xí)題300
第9章離群點(diǎn)檢測(cè)301
9.1離群點(diǎn)的定義與類型301
9.1.1什么是離群點(diǎn)301
9.1.2離群點(diǎn)的類型302
9.2離群點(diǎn)的檢測(cè)303
9.2.1檢測(cè)方法的分類303
9.2.2統(tǒng)計(jì)學(xué)方法304
9.2.3近鄰性方法307
9.2.4基于聚類的方法309
9.2.5基于分類的方法313
9.3習(xí)題314
附錄AWeka的安裝及使用規(guī)范315
A.1Weka簡(jiǎn)介與安裝315
A.1.1Weka簡(jiǎn)介315
A.1.2JRE的安裝315
A.1.3Weka的安裝318
A.2Weka的使用方法323
A.3Weka的數(shù)據(jù)格式326
參考文獻(xiàn)330

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)