第1章 緒論
1.1 研究背景和意義
1.2 研究目的
1.3 基本生物知識
1.3.1 細胞
1.3.2 脫氧核糖核酸(DNA)
1.3.3 基因和基因組
1.3.4 蛋白質和蛋白質組
1.3.5 基因和蛋白質的關系——中心法則
1.3.6 基因表達及調控
1.4 基因表達數據的聚類分析
1.4.1 基因表達數據的獲取
1.4.2 基因表達數據的類型
1.4.3 基因表達數據的特點
1.4.4 聚類基因表達數據的應用
1.4.5 基因表達數據對聚類技術提出的挑戰(zhàn)
1.4.6 聚類基因表達數據技術的分類
1.5 本書的研究內容和主要貢獻
1.6 本書的組織結構
第2章 相關研究工作
2.1 子空間聚類
2.1.1 基于距離的子空間聚類
2.1.2 基于模式/趨勢的子空間聚類
2.2 投影聚類
2.2.1 基于超立方體的方法
2.2.2 基于劃分的方法
2.2.3 基于層次的投影聚類
2.2.4 基于密度的投影聚類
2.2.5 基于模型的投影聚類
2.3 雙聚類
2.3.1 基于最小MSR的方法
2.3.2 基于格子模型的方法
2.3.3 基于頻譜的方法
2.3.4 基于最大權重子圖的方法
2.4 本章小結
第3章 最大子空間共調控基因聚類
3.1 正負共調控基因聚類Co-Cluster
3.1.1 國際研究現(xiàn)狀
3.1.2 基本概念
3.1.3 基因相似性
3.1.4 Co.Cluster算法
3.1.5 實驗測試與結果分析
3.1.6 結果的生物意義
3.2 時間平移正負共調控基因聚類:Reg-Cluster
3.2.1 國際研究現(xiàn)狀
3.2.2 基本概念和問題定義
3.2.3 Reg-Cluster聚類算法
3.2.4 實驗測試與結果分析
3.3 局部保守最大共調控基因聚類
3.3.1 國際研究現(xiàn)狀
3.3.2 相關概念和問題定義
3.3.3 LC-Cluster算法
3.3.4 實驗測試與結果分析
3.4 本章小結
第4章 考慮基因間相互關系的投影聚類
4.1 研究現(xiàn)狀及存在的問題
4.2 基本概念和問題定義
4.3 投影聚類算法MOLLON
4.3.1 平凡子序列的削減
4.3.2 基本MOLLON算法
4.3.3 討論
4.4 實驗測試與結果分析
4.4.1 數據集
4.4.2 算法的效率
4.4.3 算法的有效性
4.5 本章小結
第5章 基于迭代重聚類的基因表達數據聚類算法
5.1 研究現(xiàn)狀及存在的問題
5.2 相關工作
5.2.1 基因表達矩陣
5.2.2 數據預處理
5.2.3 數據標準化
5.2.4 相似性度量
5.3 CRADLE聚類算法
5.3.1 基本定義
5.3.2 初始聚類
5.3.3 迭代的重聚類
5.3.4 基于范數的多維數據模糊聚類E.CRADLE
5.4 實驗測試及分析
5.4.1 算法可伸縮性分析
5.4.2 聚類結果的可靠性分析
5.4.3 數據集聚類結果分析
5.5 本章小結
第6章 MFCC:一種高效的三維基因表達數據挖掘算法
6.1 研究現(xiàn)狀及存在的問題
6.2 基本概念
6.3 MFCC算法
6.3.1 二維切片挖掘
6.3.2 三維頻繁閉項集結果生成
6.3.3 算法正確性證明
6.4 實驗測試與結果分析
6.4.1 RSM與CubeMiner進行比較
6.4.2 可擴展性
6.5 本章小結
第7章 結束語
7.1 本書工作總結
7.2 未來的研究方向
作者文獻
參考文獻