注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)庫挖掘/數(shù)據(jù)倉庫高維聚類知識發(fā)現(xiàn)關(guān)鍵技術(shù)研究及應(yīng)用

高維聚類知識發(fā)現(xiàn)關(guān)鍵技術(shù)研究及應(yīng)用

高維聚類知識發(fā)現(xiàn)關(guān)鍵技術(shù)研究及應(yīng)用

定 價:¥26.00

作 者: 陳建斌 著
出版社: 電子工業(yè)出版社
叢編項:
標(biāo) 簽: 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘

ISBN: 9787121082481 出版時間: 2009-03-01 包裝: 平裝
開本: 大32開 頁數(shù): 217 字數(shù):  

內(nèi)容簡介

  知識發(fā)現(xiàn)是從數(shù)據(jù)集中抽取和精化新的模式的過程,基于數(shù)據(jù)庫的知識發(fā)現(xiàn)(Knowledge Discovery in Database,KDD))是知識發(fā)現(xiàn)研究的主體和熱點,而聚類知識發(fā)現(xiàn)又是知識發(fā)現(xiàn)的重要方面。如何有效處理巨量、高維的數(shù)據(jù),是當(dāng)前聚類分析的關(guān)鍵技術(shù)。本書圍繞高維數(shù)據(jù)的聚類問題展開研究,在討論高維數(shù)據(jù)相似I生尤其是高維二元數(shù)據(jù)相似性定義的基礎(chǔ)上,提出了基于粗圖模型的硬聚類和軟聚類算法、高維二元數(shù)據(jù)的映射聚類算法、基于螞蟻行為的聚類算法等,并進一步提出基于映射聚類的離群點檢測方法;還特別討論了高維聚類結(jié)果的表示方法問題,提出了應(yīng)用粗糙集高效表達聚類結(jié)果的方法;最后探討了聚類知識發(fā)現(xiàn)數(shù)據(jù)建模的基本步驟,給出了聚類知識發(fā)現(xiàn)的典型應(yīng)用案例。本書學(xué)術(shù)性、知識性并重,可供從事數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教學(xué)、研究的師生、學(xué)者閱讀,也可以為從事數(shù)據(jù)挖掘、知識發(fā)現(xiàn)系統(tǒng)等軟件工程技術(shù)人員提供參考。

作者簡介

  陳建斌,男,山西長治人。2005年獲計算機應(yīng)用專業(yè)博士學(xué)位。國家職業(yè)技能鑒定專家委員會企業(yè)信息管理專家組組長,中國機械工業(yè)企業(yè)管理協(xié)會專家委員會委員,北京聯(lián)合大學(xué)商務(wù)學(xué)院副教授、電子商務(wù)研究所所長,高級企業(yè)信息管理師。主要研究方向為企業(yè)信息化管理與運作、電子商務(wù)與電子政務(wù)和商務(wù)智能。 作者多年來秉承系統(tǒng)工程思想,開展企業(yè)信息化管理的研究與實踐,主編了《企業(yè)信息管理師培訓(xùn)教程》、《ERP工程師培訓(xùn)教程》、《電子商務(wù)與電子政務(wù)》、《電子商務(wù)與現(xiàn)代物流》和《信息經(jīng)濟學(xué)》等多部著作,參與國家自然科學(xué)基金項目多項,主持省部級科研項目多項,在國內(nèi)核心期刊及國際學(xué)術(shù)會議上發(fā)表論文三十余篇。作為高級顧問和專家組組長,主講和輔導(dǎo)中央企業(yè)信息管理師職業(yè)資格培訓(xùn)數(shù)十期;參與多項企業(yè)信息化戰(zhàn)略規(guī)劃,數(shù)據(jù)倉庫規(guī)劃與建設(shè)和企業(yè)診斷等項目。

圖書目錄

第1章 知識發(fā)現(xiàn)與KDD
1.1 知識與知識發(fā)現(xiàn)
1.1.1 知識
1.1.2 知識發(fā)現(xiàn)和KDD
1.1.3 知識發(fā)現(xiàn)的過程
1.2 數(shù)據(jù)庫知識發(fā)現(xiàn)——KDD
1.2.1 KDD的產(chǎn)生與發(fā)展
1.2.2 KDD的一般機理和理論基礎(chǔ)
1.2.3 KDD系統(tǒng)的基本框架
1.2.4 KDD的主要任務(wù)
第2章 聚類知識發(fā)現(xiàn)及其關(guān)鍵技術(shù)
2.1 聚類問題的主要方法
2.2 聚類問題的關(guān)鍵技術(shù)
2.2.1 數(shù)據(jù)倉庫技術(shù)
2.2.2 高維聚類技術(shù)
2.3 高維聚類關(guān)鍵技術(shù)研究
2.3.1 高維聚類的主要算法
2.3.2 高維聚類算法的關(guān)鍵技術(shù)
第3章 高維數(shù)據(jù)相似性的定義
3.1 數(shù)據(jù)相似關(guān)系
3.1.1 基于距離的相似性定義
3.1.2 基于密度的相似性定義
3.1.3 基于連接的相似性定義
3.2 高維數(shù)據(jù)相似關(guān)系的定義
3.3 二元數(shù)據(jù)相似性的定義
3.3.1 屬性分布特征向量
3.3.2 對象間屬性分布相似性
3.4 小結(jié)
第4章 基于粗圖模型的聚類算法
4.1 圖論基礎(chǔ)概念
4.2 基于圖論的聚類算法
4.2.1 聚集型圖論聚類
4.2.2 多層粗圖法
4.2.3 基于二部圖的方法
4.3 圖劃分的關(guān)鍵技術(shù)
4.3.1 圖的多層二分劃(Multilevel Graph Bisection)
4.3.2 增強譜分割算法
4.3.3 圖的非平衡劃分技術(shù)
4.4 多層粗圖聚類算法的改進
4.4.1 聚類算法
4.4.2 圖分割的精化算法
4.4.3 聚類質(zhì)量評價
4.4.4 實驗結(jié)果
4.4.5 算法評價
4.5 基于粗圖模型的軟聚類方法
4.5.1 引言
4.5.2 軟聚類算法
4.5.3 基于圖劃分法的軟聚類GPSC算法
4.5.4 實驗分析
4.5.5 軟聚類方法的評價
4.6 小結(jié)
第5章 高維二元數(shù)據(jù)的映射聚類算法
5.1 引言
5.2 二元數(shù)據(jù)
5.3 映射聚類模型
5.3.1 伯努利分布(Bernoulli distribution)
5.3.2 有限混合伯努利分布
5.3.3 似然函數(shù)
5.3.4 EM算法
5.3.5 伯努利混合模型的EM算法
5.3.6 基于混合模型的映射聚類思想
5.4 映射聚類算法
5.5 實驗結(jié)果
5.6 小結(jié)
第6章 基于螞蟻行為的聚類方法
6.1 螞蟻算法綜述
6.2 Deneubourg基本模型及LF聚類算法
6.2.1 數(shù)據(jù)對象表示方法及相似性量度
6.2.2 Deneubourg基本模型
6.2.3 LF聚類算法
6.3 基于密度的啟發(fā)性群體智能聚類算法——HDBCSI
6.3.1 記憶體
6.3.2 基于密度的先行策略
6.3.3 基于密度的啟發(fā)性群體智能聚類算法HDBCSI算法描述
6.3.4 算法測試與比較分析
6.3.5 螞蟻算法評價
6.4 小結(jié)
第7章 高維數(shù)據(jù)空間的離群點檢測方法
7.1 概述
7.2 高維空間中的離群點發(fā)現(xiàn)
7.3 子空間離群點發(fā)現(xiàn)算法綜述
7.4 映射離群點發(fā)現(xiàn)的思考
7.5 映射離群點發(fā)現(xiàn)算法的設(shè)計
7.5.1 映射聚類算法
7.5.2 基于熵的屬性選擇
7.5.3 離散屬性中離群點的確定
7.5.4 簇外屬性檢測
7.6 算法描述及分析
7.7 小結(jié)
第8章 高維數(shù)據(jù)聚類結(jié)果的表示
8.1 聚類結(jié)果表示方式概述
8.1.1 數(shù)據(jù)可視化
8.1.2 表達式法
8.2 基于粗糙集理論的知識表示
8.2.1 粗糙集基礎(chǔ)理論
8.2.2 屬性空間上的rough集理論
8.3 基于粗糙集理論的聚類結(jié)果表達
8.3.1 一般聚類知識的表達
8.3.2 高維二元映射聚類結(jié)果的粗糙集表示
8.4 小結(jié)
第9章 聚類知識發(fā)現(xiàn)數(shù)據(jù)建模及應(yīng)用
9.1 數(shù)據(jù)模型的建立
9.1.1 數(shù)據(jù)倉庫的體系結(jié)構(gòu)與建模方法
9.1.2 多維數(shù)據(jù)模型對分析型應(yīng)用的支持
9.1.3 數(shù)據(jù)建模方案
9.2 應(yīng)用數(shù)據(jù)準(zhǔn)備
9.2.1 數(shù)據(jù)準(zhǔn)備的內(nèi)容
9.2.2 數(shù)據(jù)凈化的方法
9.2.3 數(shù)據(jù)的精簡
9.3 聚類知識發(fā)現(xiàn)的應(yīng)用——電信市場客戶分群
9.3.1 客戶聚類分析流程
9.3.2 戰(zhàn)術(shù)分群與目標(biāo)市場營銷
9.4 小結(jié)
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號