目錄
第1章 緒論\t1
1.1 數據挖掘概述\t1
1.1.1 數據挖掘的發(fā)展狀況\t1
1.1.2 數據挖掘的概念\t2
1.1.3 數據挖掘技術概述\t5
1.1.4 數據挖掘方法比較\t9
1.1.5 數據挖掘面臨的問題\t10
1.2 數據挖掘中的軟計算技術概述\t11
1.2.1 軟計算的發(fā)展狀況\t12
1.2.2 KDD中的軟計算技術簡介\t13
1.3 基于WWW的數據挖掘與文本挖掘\t19
1.3.1 基于WWW的數據挖掘\t19
1.3.2 自然語言處理與文本挖掘\t20
1.4 研究現狀與發(fā)展趨勢\t21
參考文獻\t23
第2章 基于智能Agent的知識發(fā)現模型研究與設計\t27
2.1 知識發(fā)現模型概述\t27
2.1.1 面向過程的KDD模型\t28
2.1.2 面向用戶的KDD模型\t30
2.1.3 面向知識的KDD模型\t31
2.2 基于Agent技術的智能數據挖掘系統(tǒng)模型的總體結構\t32
2.2.1 Multi-Agent技術的特性\t32
2.2.2 智能數據挖掘系統(tǒng)模型的總體結構\t34
2.2.3 數據挖掘Agent功能描述\t35
2.2.4 數據預處理Agent功能描述\t36
2.2.5 人機界面Agent功能描述\t37
2.2.6 決策Agent功能描述\t38
2.3 知識發(fā)現過程實例分析\t39
2.3.1 實例背景\t39
2.3.2 數據預處理\t40
2.3.3 特征選擇\t43
2.4 研究現狀與發(fā)展趨勢\t47
2.5 本章小結\t48
參考文獻\t49
第3章 基于軟計算的知識表示方法研究\t51
3.1 知識表示概述\t51
3.1.1 一階謂詞邏輯表示法\t52
3.1.2 關系表示法\t53
3.1.3 產生式規(guī)則表示法\t53
3.1.4 框架表示法\t54
3.1.5 語義網絡表示法\t55
3.1.6 面向對象表示法\t56
3.1.7 知識表達式\t56
3.1.8 模糊知識表示方法\t58
3.2 基于粗糙集的不確定知識表示方法\t61
3.2.1 知識、劃分與等價關系\t61
3.2.2 信息表、不可分辨關系和基本集\t61
3.2.3 粗糙集的下近似、上近似及邊界區(qū)\t62
3.2.4 知識表示特征集模型\t62
3.2.5 討論\t64
3.3 基于粗糙熵的知識表示方法\t64
3.3.1 信息理論的度量和粗糙集\t64
3.3.2 知識的粗糙性\t65
3.3.3 粗糙熵\t65
3.4 知識的對象模糊語義網絡表示法\t65
3.5 幾種知識表示方法的比較\t66
3.6 研究現狀與發(fā)展趨勢\t67
3.7 本章小結\t68
參考文獻\t71
第4章 數據挖掘中的小波神經網絡方法研究\t73
4.1 引言\t73
4.2 神經網絡發(fā)展及基礎概述\t73
4.2.1 MP模型\t74
4.2.2 感知器學習算法\t75
4.2.3 BP網絡算法\t75
4.3 基于禁忌搜索算法的小波神經網絡設計\t77
4.3.1 禁忌搜索\t77
4.3.2 小波分析基礎\t82
4.3.3 小波變換實例\t84
4.3.4 小波神經網絡\t86
4.3.5 網絡設計算法\t86
4.3.6 實驗結果及結論\t87
4.4 基于小波神經網絡的模型預測研究\t88
4.4.1 Harr基小波\t88
4.4.2 Harr基小波神經網絡\t89
4.4.3 預測模型\t90
4.5 BP神經網絡\t91
4.5.1 算法實現\t91
4.5.2 運行實例\t94
4.6 神經網絡在數據挖掘中的應用\t94
4.6.1 神經網絡在可視化中的應用\t94
4.6.2 神經網絡在分類中的應用\t96
4.6.3 實驗結果及分析\t98
4.7 研究現狀與發(fā)展趨勢\t99
4.8 本章小結\t100
參考文獻\t100
第5章 基于用戶需求模型的中英文WWW搜索引擎\t104
5.1 WWW概述\t104
5.1.1 搜索引擎技術\t105
5.1.2 WWW中的術語、協議及相關技術\t106
5.2 中英文WWW搜索引擎的結構\t109
5.2.1 數據收集、處理子系統(tǒng)\t110
5.2.2 用戶查詢子系統(tǒng)\t111
5.2.3 分類管理子系統(tǒng)\t112
5.3 基于示例的用戶信息需求模型的獲取和表示\t113
5.3.1 文本類別特征的抽取方式\t114
5.3.2 文本的分類判別與文本特征權重\t115
5.3.3 Fisher判別\t116
5.3.4 用戶信息需求模型的表示\t119
5.3.5 實驗結果及分析\t119
5.4 研究現狀與發(fā)展趨勢\t120
5.5 本章小結\t121
參考文獻\t121
第6章 基于Web的文本挖掘技術研究\t123
6.1 文本挖掘概述\t123
6.1.1 文本挖掘的應用\t124
6.1.2 文本處理的基本模型\t125
6.1.3 文本挖掘的流程\t128
6.2 文本挖掘基本技術\t128
6.2.1 文本特征抽取\t128
6.2.2 文本分類\t132
6.2.3 文本聚類\t133
6.2.4 DBSCAN聚類\t134
6.3 中文文本挖掘模型\t137
6.3.1 文本特征的提取\t137
6.3.2 重心向量與文本聚類\t139
6.3.3 文本自動摘要技術\t140
6.3.4 文本可視化表示\t141
6.4 研究現狀與發(fā)展趨勢\t143
6.5 本章小結\t144
參考文獻\t145
第7章 聚類分析與應用\t147
7.1 聚類的基本概念\t147
7.1.1 聚類的定義\t147
7.1.2 聚類算法的分類\t148
7.1.3 數據挖掘中聚類算法的比較標準\t148
7.2 常用聚類算法介紹與分析\t149
7.2.1 基于劃分的聚類算法\t149
7.2.2 基于層次的聚類算法\t151
7.2.3 基于密度的聚類算法\t152
7.2.4 基于網格的聚類算法\t153
7.2.5 基于模型的聚類算法[3]\t154
7.3 聚類算法比較\t155
7.4 聚類算法k-means的改進\t155
7.4.1 聚類算法中的數據類型\t155
7.4.2 相異度的計算\t156
7.4.3 聚類準則\t157
7.4.4 原始的k-means算法\t157
7.4.5 改進的k-means算法\t161
7.5 研究現狀與發(fā)展趨勢\t166
7.6 本章小結\t166
參考文獻\t167
第8章 軟計算中的算法及其應用\t169
8.1 分類概述\t169
8.2 決策樹\t169
8.2.1 決策樹的概念\t170
8.2.2 決策樹的研究方向\t171
8.2.3 決策樹分析\t171
8.2.4 決策樹算法\t173
8.3 分類的應用\t184
8.3.1 基于支持向量機的印刷故障分類\t184
8.3.2 票據印刷過程中的數碼檢測\t190
8.4 遺傳算法\t192
8.4.1 算法實現\t192
8.4.2 算法運行\(zhòng)t198
8.5 研究現狀與發(fā)展趨勢\t199
8.6 本章小結\t200
參考文獻\t200