第1章 數據挖掘研究進展 1
1.1 數據挖掘基本理論 1
1.2 數據挖掘存在的問題 8
1.3 數據挖掘研究現狀 9
1.3.1 特征降維 9
1.3.2 智能分類 12
1.3.3 聚類分析 13
1.4 研究思路 15
第2章 特征降維方法研究 16
2.1 背景知識 16
2.1.1 線性判別分析 16
2.1.2 保局投影算法 18
2.2 基于多階矩陣組合的LDA 19
2.3 標量化的線性判別分析算法 20
2.4 基于矩陣指數的線性判別分析算法 22
2.5 基于圖的數據降維方法 24
2.6 融合全局和局部特征的特征提取方法 26
2.6.1 化問題 27
2.6.2 算法描述 28
2.6.3 復雜度分析 28
2.7 基于Fisher準則的半監(jiān)督數據降維方法 29
2.8 特征提取新視角:基于Parzen窗估計的方法 31
2.8.1 Parzen窗 31
2.8.2 Parzen窗與LPP 32
2.8.3 Parzen窗與LDA 35
2.8.4 Parzen窗與PCA 38
2.8.5 推廣性結論 41
第3章 基于數據分布特征的智能分類方法 42
3.1 背景知識 42
3.1.1 支持向量機 42
3.1.2 支持向量數據描述 43
3.1.3 流形判別分析 44
3.1.4 模糊理論 45
3.1.5 核心向量機 46
3.2 基于流形判別分析的全局保序學習機 46
3.2.1 GRPLM原理 48
3.2.2 大規(guī)模分類 51
3.3 基于散度差的保序分類算法 52
3.3.1 化問題 52
3.3.2 大規(guī)模分類 54
3.4 小流形類內離散度支持向量機 54
3.4.1 MCVSVM 55
3.4.2 小MWCS支持向量機 56
3.4.3 理論分析 58
3.5 基于核密度估計與熵理論的間隔學習機 59
3.5.1 核密度估計和熵理論 59
3.5.2 MEKLM原理 60
3.5.3 理論分析 63
第4章 基于決策邊界的智能分類方法 66
4.1 支持向量數據描述 66
4.2 具有N-S磁極效應的間隔模糊分類器 67
4.2.1 N-S磁極效應 68
4.2.2 MPMMFC原理 68
4.2.3 理論分析 72
4.3 基于光束角思想的間隔學習機 73
4.3.1 光束角 74
4.3.2 BAMLM原理 74
4.3.3 CCMEB及BACVM 78
4.4 面向大規(guī)模數據的模糊支持向量數據描述 79
4.4.1 模糊支持向量數據描述 79
4.4.2 FSVDD-CVM 81
4.5 基于信度的BP神經網絡 82
4.5.1 BP神經網絡 83
4.5.2 基于信度的BP算法 85
第5章 天文數據挖掘研究進展 87
5.1 引言 87
5.2 大型巡天項目 87
5.3 天文數據的特點 90
5.4 天文學中的數據挖掘 91
5.4.1 天文數據挖掘的必要性 92
5.4.2 天文數據挖掘的主要任務 92
5.5 天文數據挖掘應用研究 94
5.6 光譜自動分類方法研究 96
第6章 基于支持向量機及其變種的恒星光譜分類方法 99
6.1 基于流形模糊雙支持向量機的恒星光譜分類方法 99
6.1.1 雙支持向量機 99
6.1.2 流形模糊雙支持向量機 100
6.1.3 實驗分析 102
6.1.4 結論 103
6.2 基于多類支持向量機的恒星光譜分類方法 103
6.2.1 多類支持向量機 104
6.2.2 實驗分析 106
6.2.3 結論 107
6.3 基于流形判別分析和支持向量機的恒星光譜數據自動分類方法 107
6.3.1 基于流形判別分析的支持向量機 107
6.3.2 實驗分析 110
6.3.3 結論 111
6.4 基于小類內散度、類間散度支持向量機的恒星光譜分類 111
6.4.1 MMSVM 111
6.4.2 實驗分析 112
6.4.3 結論 114
6.5 基于模糊小類內散度支持向量機的恒星光譜分類 114
6.5.1 FMWSVM 114
6.5.2 實驗分析 115
6.5.3 結論 117
第7章 稀有天體光譜自動發(fā)現方法 118
7.1 利用基于熵的單類學習機發(fā)現稀有光譜 118
7.1.1 熵理論 119
7.1.2 基于熵的單類學習機 119
7.1.3 基于核心向量機的OCLM 120
7.1.4 實驗分析 121
7.1.5 結論 125
7.2 利用基于互信息的非平衡分類方法識別稀有光譜 125
7.2.1 背景知識 126
7.2.2 決策樹的構造 127
7.2.3 剪枝方法 128
7.2.4 基于互信息的代價缺失決策樹 128
7.2.5 實驗分析 129
7.2.6 結論 133
7.3 基于模糊大間隔小球分類模型的恒星光譜離群數據挖掘方法 133
7.3.1 模糊大間隔小球分類模型 133
7.3.2 實驗分析 136
7.3.3 結論 137
第8章 恒星光譜自動分類方法新發(fā)展 138
8.1 基于非線性學習機的大規(guī)模恒星光譜分類方法 138
8.1.1 非線性集成學習機 138
8.1.2 實驗分析 140
8.1.3 結論 145
8.2 基于Fisher準則和流形學習的恒星光譜分類方法 145
8.2.1 基于Fisher準則和流形學習的分類方法 146
8.2.2 CFCM與傳統(tǒng)降維方法的關系 150
8.2.3 實驗分析 150
8.2.4 結論 153
8.3 利用帶無標簽數據的雙支持向量機對恒星光譜分類 153
8.3.1 帶無標簽數據的雙支持向量機 153
8.3.2 算法描述 155
8.3.3 實驗分析 155
8.3.4 結論 157
第9章 天文大數據挖掘 158
9.1 研究背景 158
9.1.1 天文大數據 158
9.1.2 大數據處理技術 159
9.2 天文大數據處理的關鍵技術 161
9.2.1 天文大數據處理框架 161
9.2.2 天文大數據分布式存儲技術 164
9.2.3 天文大數據并行化計算技術 168
9.2.4 天文大數據分析方法 169
9.2.5 天文大數據處理技術存在的問題與不足 171
9.3 天文大數據機器學習 172
9.3.1 研究背景和問題 172
9.3.2 天文大數據機器學習系統(tǒng)的特征 172
9.3.3 主要研究問題 173
9.3.4 研究進展 173
參考文獻 175