知識發(fā)現(xiàn)是從數(shù)據(jù)集中抽取和精化新的模式的過程,基于數(shù)據(jù)庫的知識發(fā)現(xiàn)(Knowledge Discovery in Database,KDD))是知識發(fā)現(xiàn)研究的主體和熱點,而聚類知識發(fā)現(xiàn)又是知識發(fā)現(xiàn)的重要方面。如何有效處理巨量、高維的數(shù)據(jù),是當(dāng)前聚類分析的關(guān)鍵技術(shù)。本書圍繞高維數(shù)據(jù)的聚類問題展開研究,在討論高維數(shù)據(jù)相似I生尤其是高維二元數(shù)據(jù)相似性定義的基礎(chǔ)上,提出了基于粗圖模型的硬聚類和軟聚類算法、高維二元數(shù)據(jù)的映射聚類算法、基于螞蟻行為的聚類算法等,并進一步提出基于映射聚類的離群點檢測方法;還特別討論了高維聚類結(jié)果的表示方法問題,提出了應(yīng)用粗糙集高效表達聚類結(jié)果的方法;最后探討了聚類知識發(fā)現(xiàn)數(shù)據(jù)建模的基本步驟,給出了聚類知識發(fā)現(xiàn)的典型應(yīng)用案例。本書學(xué)術(shù)性、知識性并重,可供從事數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教學(xué)、研究的師生、學(xué)者閱讀,也可以為從事數(shù)據(jù)挖掘、知識發(fā)現(xiàn)系統(tǒng)等軟件工程技術(shù)人員提供參考。