注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嵺`

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嵺`

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嵺`

定 價(jià):¥48.00

作 者: 李春葆,李石君,李筱馳 著
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 計(jì)算機(jī)/網(wǎng)絡(luò) 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 數(shù)據(jù)庫

ISBN: 9787121244926 出版時(shí)間: 2014-11-01 包裝: 平裝
開本: 16開 頁數(shù): 368 字?jǐn)?shù):  

內(nèi)容簡介

  本書系統(tǒng)地介紹了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù),全本由兩部分組成,第1章到第3章介紹數(shù)據(jù)倉庫的基本概念和相關(guān)技術(shù),第4章到第11章介紹數(shù)據(jù)挖掘的基本概念和各種算法,包括數(shù)據(jù)倉庫構(gòu)建、OLAP技術(shù)、分類方法、聚類方法、關(guān)聯(lián)分析、序列模式挖掘方法、回歸和時(shí)序分析、粗糙集理論、文本挖掘、Web挖掘和空間數(shù)據(jù)挖掘方法等。本書既注重原理,又注重實(shí)踐,配有大量圖表、示例和練習(xí)題,內(nèi)容豐富,概念講解清楚,表達(dá)嚴(yán)謹(jǐn),邏輯性強(qiáng),語言精練,可讀性好。本書既便于教師課堂講授,又便于自學(xué)者閱讀。適合作為高等院校高年級學(xué)生和研究生“數(shù)據(jù)倉庫和數(shù)據(jù)挖掘”或“數(shù)據(jù)挖掘算法”課程的教材。

作者簡介

  武漢大學(xué)計(jì)算機(jī)學(xué)院教授,主持和參加3S系統(tǒng)集成關(guān)鍵技術(shù)的研究(國家自然科學(xué)基金重點(diǎn)科技攻關(guān)項(xiàng)目,49631050)、城市地理信息系統(tǒng)標(biāo)準(zhǔn)規(guī)范的研究(國家測繪局項(xiàng)目)、伊藤算法及其在動態(tài)仿真優(yōu)化中的理論研究(60873114/F020102)、湖北省財(cái)政廳三查管理信息系統(tǒng)、湖北省財(cái)政廳外匯管理信息系統(tǒng)、湖北省財(cái)政廳財(cái)政監(jiān)督管理信息系統(tǒng)、武漢英華ERP系統(tǒng)等項(xiàng)目。

圖書目錄

第 1 章數(shù)據(jù)倉庫概述 (1)
1.1 數(shù)據(jù)倉庫及其歷史 (1)
1.1.1 數(shù)據(jù)庫技術(shù)的發(fā)展 (1)
1.1.2 什么是數(shù)據(jù)倉庫 (2)
1.2 數(shù)據(jù)倉庫系統(tǒng)及其開發(fā)工具 (5)
1.2.1 數(shù)據(jù)倉庫系統(tǒng)的組成 (5)
1.2.2 ETL (6)
1.2.3 數(shù)據(jù)倉庫和數(shù)據(jù)集市的關(guān)系 (6)
1.2.4 元數(shù)據(jù)及其管理 (7)
1.3 數(shù)據(jù)倉庫系統(tǒng)開發(fā)工具 (8)
1.4 數(shù)據(jù)倉庫與操作型數(shù)據(jù)庫的關(guān)系 (9)
1.4.1 從數(shù)據(jù)庫到數(shù)據(jù)倉庫 (9)
1.4.2 數(shù)據(jù)倉庫為什么是分離的(10)
1.4.3 數(shù)據(jù)倉庫與操作型數(shù)據(jù)庫的對比(10)
1.4.4 ODS (11)
1.5 商務(wù)智能與數(shù)據(jù)倉庫的關(guān)系(11)
練習(xí)題 1 (12)
思考題 1 (13)
第 2 章數(shù)據(jù)倉庫設(shè)計(jì) (14)
2.1 數(shù)據(jù)倉庫設(shè)計(jì)概述(14)
2.1.1 數(shù)據(jù)倉庫設(shè)計(jì)原則(14)
2.1.2 數(shù)據(jù)倉庫構(gòu)建模式(14)
2.1.3 數(shù)據(jù)倉庫設(shè)計(jì)步驟(15)
2.2 數(shù)據(jù)倉庫的規(guī)劃和需求分析(15)
2.2.1 數(shù)據(jù)倉庫的規(guī)劃(15)
2.2.2 數(shù)據(jù)倉庫的需求分析(16)
2.3 數(shù)據(jù)倉庫的建模(17)
2.3.1 多維數(shù)據(jù)模型及相關(guān)概念(17)
VI
2.3.2 多維數(shù)據(jù)模型的實(shí)現(xiàn)(18)
2.3.3 數(shù)據(jù)倉庫建模的主要工作(19)
2.3.4 幾種常見的基于關(guān)系數(shù)據(jù)庫的多維數(shù)據(jù)模型(21)
2.4 數(shù)據(jù)倉庫的物理模型設(shè)計(jì)(26)
2.4.1 確定數(shù)據(jù)的存儲結(jié)構(gòu)(27)
2.4.2 確定索引策略(27)
2.4.3 確定存儲分配(27)
2.5 數(shù)據(jù)倉庫的部署和維護(hù)(28)
2.5.1 數(shù)據(jù)倉庫的部署(28)
2.5.2 數(shù)據(jù)倉庫的維護(hù)(28)
2.6 一個(gè)簡單的數(shù)據(jù)倉庫SDWS 設(shè)計(jì)示例(29)
2.6.1 SDWS 的需求分析(29)
2.6.2 SDWS 的建模(29)
2.6.3 基于SQL Server 2008 設(shè)計(jì)SDWS(35)
練習(xí)題 2(42)
思考題 2(43)
第 3 章 OLAP 技術(shù) (44)
3.1 OLAP 概述(44)
3.1.1 什么是OLAP (44)
3.1.2 OLAP 技術(shù)的特性(44)
3.1.3 OLAP 和OLTP 的區(qū)別(45)
3.1.4 數(shù)據(jù)倉庫與OLAP 的關(guān)系(46)
3.1.5 OLAP 分類(46)
3.2 OLAP 的多維數(shù)據(jù)模型(48)
3.2.1 多維數(shù)據(jù)模型的定義(48)
3.2.2 OLAP 的基本分析操作(49)
3.2.3 一個(gè)簡單的多維數(shù)據(jù)模型(53)
3.3 OLAP 實(shí)現(xiàn)(56)
3.3.1 數(shù)據(jù)立方體的有效計(jì)算(56)
3.3.2 索引OLAP 數(shù)據(jù)(61)
3.3.3 OLAP 查詢的有效處理(62)
練習(xí)題 3(63)
思考題 3(64)
第 4 章數(shù)據(jù)挖掘概述 (65)
4.1 什么是數(shù)據(jù)挖掘(65)
4.1.1 數(shù)據(jù)挖掘的定義(65)
4.1.2 數(shù)據(jù)挖掘的知識表示(66)
4.1.3 數(shù)據(jù)挖掘的主要任務(wù)(66)
4.1.4 數(shù)據(jù)挖掘的發(fā)展(67)
VII
4.1.5 數(shù)據(jù)挖掘的對象(67)
4.1.6 數(shù)據(jù)挖掘的分類(68)
4.1.7 數(shù)據(jù)挖掘與數(shù)據(jù)倉庫及OLAP 的關(guān)系(68)
4.1.8 數(shù)據(jù)挖掘的應(yīng)用(69)
4.2 數(shù)據(jù)挖掘系統(tǒng)(70)
4.2.1 數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu)(70)
4.2.2 數(shù)據(jù)挖掘系統(tǒng)的設(shè)計(jì)(71)
4.2.3 常用的數(shù)據(jù)挖掘系統(tǒng)及其發(fā)展(73)
4.3 數(shù)據(jù)挖掘過程(74)
4.3.1 數(shù)據(jù)挖掘步驟(74)
4.3.2 數(shù)據(jù)清理(74)
4.3.3 數(shù)據(jù)集成(75)
4.3.4 數(shù)據(jù)變換(76)
4.3.5 數(shù)據(jù)歸約(77)
4.3.6 離散化和概念分層生成(79)
4.3.7 數(shù)據(jù)挖掘的算法(81)
4.4 數(shù)據(jù)挖掘的未來展望(83)
練習(xí)題 4 (83)
思考題 4 (84)
第 5 章關(guān)聯(lián)分析 (85)
5.1 關(guān)聯(lián)分析的概念(85)
5.1.1 事務(wù)數(shù)據(jù)庫(85)
5.1.2 關(guān)聯(lián)規(guī)則及其度量(86)
5.1.3 頻繁項(xiàng)集(87)
5.1.4 挖掘關(guān)聯(lián)規(guī)則的基本過程(87)
5.2 Apriori 算法(88)
5.2.1 Apriori 性質(zhì)(88)
5.2.2 Apriori 算法(89)
5.2.3 由頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則(93)
5.2.4 提高Apriori 算法的有效性(96)
5.2.5 非二元屬性的關(guān)聯(lián)規(guī)則挖掘(99)
5.3 頻繁項(xiàng)集的緊湊表示(100)
5.3.1 最大頻繁項(xiàng)集(100)
5.3.2 頻繁閉項(xiàng)集(101)
5.4 FP-growth 算法(103)
5.4.1 FP-growth 算法框架(103)
5.4.2 FP 樹構(gòu)造(104)
5.4.3 由FP 樹產(chǎn)生頻繁項(xiàng)集(107)
5.5 多層關(guān)聯(lián)規(guī)則的挖掘(109)
VIII
5.5.1 多層關(guān)聯(lián)規(guī)則的挖掘概述 (109)
5.5.2 多層關(guān)聯(lián)規(guī)則的挖掘算法 (111)
5.5.3 多維關(guān)聯(lián)規(guī)則 (114)
5.6 其他類型的關(guān)聯(lián)規(guī)則 (114)
5.6.1 基于約束的關(guān)聯(lián)規(guī)則 (114)
5.6.2 負(fù)關(guān)聯(lián)規(guī)則 (114)
5.7 SQL Server 挖掘關(guān)聯(lián)規(guī)則的示例 (115)
5.7.1 建立DM 數(shù)據(jù)庫 (115)
5.7.2 建立關(guān)聯(lián)挖掘項(xiàng)目 (116)
5.7.3 部署關(guān)聯(lián)挖掘項(xiàng)目并瀏覽結(jié)果 (120)
練習(xí)題 5 (122)
思考題 5 (126)
第 6 章序列模式挖掘(127)
6.1 序列模式挖掘概述 (127)
6.1.1 序列數(shù)據(jù)庫 (127)
6.1.2 序列模式挖掘算法 (129)
6.2 Apriori 類算法 (130)
6.2.1 AprioriAll 算法 (130)
6.2.2 AprioriSome 算法 (135)
6.2.3 DynamicSome 算法 (138)
6.2.4 GSP 算法 (140)
6.2.5 SPADE 算法 (144)
6.3 模式增長框架的序列挖掘算法 (150)
6.3.1 FreeSpan 算法 (150)
6.3.2 PrefixSpan 算法 (152)
練習(xí)題 6 (155)
思考題 6 (157)
第 7 章分類方法(158)
7.1 分類過程 (158)
7.1.1 學(xué)習(xí)階段 (158)
7.1.2 分類階段 (160)
7.2 k-最鄰近分類算法 (160)
7.3 決策樹分類算法 (162)
7.3.1 決策樹 (162)
7.3.2 建立決策樹的ID3 算法 (163)
7.3.3 建立決策樹的C4.5 算法 (173)
7.4 貝葉斯分類算法 (175)
7.4.1 貝葉斯分類概述 (175)
7.4.2 樸素貝葉斯分類 (177)
IX
7.4.3 樹增強(qiáng)樸素貝葉斯分類(183)
7.5 神經(jīng)網(wǎng)絡(luò)算法(185)
7.5.1 生物神經(jīng)元和人工神經(jīng)元(185)
7.5.2 人工神經(jīng)網(wǎng)絡(luò)(187)
7.5.3 前饋神經(jīng)網(wǎng)絡(luò)用于分類(189)
7.5.4 SQL Server 中神經(jīng)網(wǎng)絡(luò)分類示例(196)
7.6 支持向量機(jī)(199)
7.6.1 線性可分時(shí)的二元分類問題(199)
7.6.2 線性不可分時(shí)的二元分類問題(203)
練習(xí)題 7 (206)
思考題 7 (209)
第 8 章回歸分析和時(shí)序挖掘(210)
8.1 線性和非線性回歸分析(210)
8.1.1 一元線性回歸分析(210)
8.1.2 多元線性回歸分析(213)
8.1.3 非線性回歸分析(214)
8.2 邏輯回歸分析(217)
8.2.1 邏輯回歸原理(217)
8.2.2 邏輯回歸模型(218)
8.2.3 SQL Server 中邏輯回歸分析示例(219)
8.3 時(shí)序分析模型(221)
8.3.1 時(shí)序分析概述(221)
8.3.2 時(shí)序預(yù)測的常用方法(222)
8.3.3 回歸分析與時(shí)序分析的關(guān)系(223)
8.3.4 確定性時(shí)序模型(223)
8.3.5 隨機(jī)時(shí)序模型(226)
8.3.6 SQL Server 建立隨機(jī)時(shí)序模型示例(228)
8.4 時(shí)序的相似性搜索(231)
8.4.1 相似性搜索的概念(231)
8.4.2 完全匹配(232)
8.4.3 基于離散傅里葉變換的子序列匹配(232)
8.4.4 基于規(guī)范變換的子序列匹配(234)
練習(xí)題 8 (236)
思考題 8 (237)
第 9 章粗糙集理論(238)
9.1 粗糙集理論概述(238)
9.1.1 粗糙集理論的產(chǎn)生(238)
9.1.2 粗糙集理論的特點(diǎn)(238)
9.1.3 粗糙集理論在數(shù)據(jù)挖掘中的應(yīng)用(239)
X
9.2 粗糙集理論中的基本概念 (239)
9.2.1 集合的基本概念 (239)
9.2.2 信息系統(tǒng)和粗糙集 (240)
9.2.3 分類的近似度量 (244)
9.3 信息系統(tǒng)的屬性約簡 (245)
9.3.1 約簡和核 (245)
9.3.2 分辨矩陣求核 (246)
9.4 決策表及其屬性約簡 (247)
9.4.1 決策表及相關(guān)概念 (247)
9.4.2 決策表的屬性約簡算法 (251)
9.5 決策表的值約簡及其算法 (258)
9.5.1 決策規(guī)則及其簡化 (258)
9.5.2 決策規(guī)則的極小化 (261)
9.6 粗糙集在數(shù)據(jù)挖掘中的應(yīng)用示例 (265)
練習(xí)題 9 (266)
思考題 9 (269)
第 10 章聚類方法(270)
10.1 聚類概述 (270)
10.1.1 什么是聚類 (270)
10.1.2 相似性測度 (270)
10.1.3 聚類過程 (272)
10.1.4 聚類算法的評價(jià) (272)
10.1.5 聚類方法的分類 (274)
10.1.6 聚類分析在數(shù)據(jù)挖掘中的應(yīng)用 (275)
10.1.7 聚類算法的要求 (275)
10.2 基于劃分的聚類算法 (276)
10.2.1 k-均值算法 (276)
10.2.2 k-中心點(diǎn)算法 (283)
10.3 基于層次的聚類算法 (285)
10.3.1 層次聚類算法概述 (285)
10.3.2 DIANA 算法和AGNES 算法 (287)
10.3.3 BIRCH 算法 (289)
10.3.4 CURE 算法 (292)
10.3.5 ROCK 算法 (294)
10.3.6 Chameleon 算法 (295)
10.4 基于密度的聚類算法 (299)
10.4.1 DBSCAN 算法 (299)
10.4.2 OPTICS 算法 (302)
10.5 基于網(wǎng)格的聚類算法 (305)
XI
10.5.1 STING 算法(305)
10.5.2 WaveCluster 算法(307)
10.5.3 CLIQUE 算法(309)
10.6 基于模型的聚類算法(310)
10.6.1 EM 算法(310)
10.6.2 COBWEB 算法(316)
10.7 離群點(diǎn)分析(320)
10.7.1 離群點(diǎn)概述(320)
10.7.2 常見的離群點(diǎn)檢測方法(321)
練習(xí)題 10 (322)
思考題 10 (323)
第 11 章其他挖掘方法(324)
11.1 文本挖掘(324)
11.1.1 文本挖掘概述(324)
11.1.2 數(shù)據(jù)預(yù)處理技術(shù)(325)
11.1.3 文本結(jié)構(gòu)分析(327)
11.1.4 文本分類(328)
11.1.5 文本聚類(330)
11.1.6 文本摘要(332)
11.1.7 文本關(guān)聯(lián)分析(332)
11.2 Web 挖掘(333)
11.2.1 Web 挖掘概述(333)
11.2.2 Web 結(jié)構(gòu)挖掘(334)
11.2.3 Web 內(nèi)容挖掘(341)
11.2.4 Web 使用挖掘(341)
11.2.5 Web 挖掘的發(fā)展方向(343)
11.3 空間數(shù)據(jù)挖掘(343)
11.3.1 空間數(shù)據(jù)概述(344)
11.3.2 空間數(shù)據(jù)立方體和空間OLAP(345)
11.3.3 空間數(shù)據(jù)挖掘方法(346)
練習(xí)題 11 (348)
思考題 11 (348)
附錄A 常用的優(yōu)化方法(350)
參考文獻(xiàn)(354)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號