注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡數(shù)據(jù)庫國之重器出版工程 特異群組挖掘

國之重器出版工程 特異群組挖掘

國之重器出版工程 特異群組挖掘

定 價:¥139.00

作 者: 熊贇,朱揚勇 著
出版社: 人民郵電出版社
叢編項:
標 簽: 暫缺

ISBN: 9787115543264 出版時間: 2020-08-01 包裝: 平裝
開本: 小16開 頁數(shù): 237 字數(shù):  

內(nèi)容簡介

  高價值、低密度是大數(shù)據(jù)的特征,挖掘高價值、低密度的數(shù)據(jù)對象是大數(shù)據(jù)的一項重要工作。特異群組是一類高價值、低密度的數(shù)據(jù)形態(tài),是指在眾多行為對象中,少數(shù)對象群體具有一定數(shù)量的相同(或相似)的行為模式,表現(xiàn)出相異于大多數(shù)對象而形成的異常的群組。特異群組挖掘在證券金融、醫(yī)療保險、智能交通、社會網(wǎng)絡和生命科學研究等領域具有重要的應用價值。對特異群組挖掘的研究代表了數(shù)據(jù)挖掘從淺層到深層的發(fā)展趨勢和必要性。本書系統(tǒng)地闡述了特異群組挖掘任務,包括介紹了特異群組挖掘的概念,分析了特異群組挖掘任務與聚類、異常等任務之間的差異,給出了特異群組挖掘任務的相關算法,并且列舉了特異群組挖掘的幾個重點應用。本書適合大數(shù)據(jù)研究人員、大數(shù)據(jù)工程師、大數(shù)據(jù)應用分析師、大數(shù)據(jù)產(chǎn)業(yè)從業(yè)人員等閱讀,也可作為數(shù)據(jù)科學、大數(shù)據(jù)專業(yè)本科生和研究生的教學用書。

作者簡介

  熊贇熊贇,復旦大學計算機科學技術(shù)學院教授、博士生導師,上海市數(shù)據(jù)科學重點實驗室副主任。研究興趣包括數(shù)據(jù)科學、數(shù)據(jù)挖掘和大數(shù)據(jù)處理。研究工作得到了國家自然科學基金、國家863計劃、國家科技支撐計劃、上海市科學技術(shù)委員會基金等資助,在TKDE、KDD、AAAI、ICDM、CIKM等數(shù)據(jù)領域國際權(quán)威期刊和會議上發(fā)表論文80余篇,擔任ACM Computing Surveys、TKDE、TKDD等國際期刊審稿人。在國內(nèi)率先開展大數(shù)據(jù)和數(shù)據(jù)科學的研究工作,出版了數(shù)據(jù)科學專著《數(shù)據(jù)學》,提出了一類大數(shù)據(jù)形態(tài)——特異群組,提出了一批新型的大數(shù)據(jù)挖掘算法,這些算法已被應用于醫(yī)療、交通和金融等上海市大數(shù)據(jù)建設的重要領域。 朱揚勇朱揚勇,復旦大學計算機科學技術(shù)學院教授、學術(shù)委員會主任,上海市數(shù)據(jù)科學重點實驗室主任?!洞髷?shù)據(jù)》期刊副主編,大數(shù)據(jù)協(xié)同安全技術(shù)國家工程實驗室副理事長,中國自動化學會國防大數(shù)據(jù)專業(yè)委員會副主任,農(nóng)業(yè)大數(shù)據(jù)產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟副理事長兼首席科學家。2004年開始從事數(shù)據(jù)科學研究,2008年提出數(shù)據(jù)資源保護和開發(fā)利用,2009年發(fā)表了數(shù)據(jù)科學論文Data Explosion, Data Nature and Dataology,并出版數(shù)據(jù)科學專著《數(shù)據(jù)學》。第462次香山科學會議“數(shù)據(jù)科學與大數(shù)據(jù)的理論問題探索”的執(zhí)行主席?!洞髷?shù)據(jù)技術(shù)與應用叢書》主編,《大數(shù)據(jù)資源》主編,大數(shù)據(jù)科普圖書《旖旎數(shù)據(jù)》作者。研究興趣包括數(shù)據(jù)科學和大數(shù)據(jù)技術(shù),提出數(shù)據(jù)界(Data Nature)、數(shù)據(jù)學(Dataology)、數(shù)據(jù)身、數(shù)據(jù)自治、數(shù)據(jù)財政等概念,近期研究重點為數(shù)據(jù)真實性、數(shù)據(jù)財政、數(shù)據(jù)資產(chǎn)、數(shù)據(jù)自治與數(shù)據(jù)跨境等。

圖書目錄

目 錄
第 1章 緒論 1
1.1 大數(shù)據(jù) 2
1.2 大數(shù)據(jù)挖掘 3
1.3 特異群組挖掘任務 6
1.4 小結(jié) 8
參考文獻 9
第 2章 為什么需要特異群組挖掘 11
2.1 聚類 12
2.2 異常檢測 13
2.3 圖數(shù)據(jù)上的異常挖掘 20
2.4 特異群組挖掘 28
2.5 特異群組挖掘與其他任務間的關系 31
2.6 小結(jié) 33
參考文獻 33
第3章 特異群組挖掘的應用 45
3.1 證券市場操縱行為挖掘 46
3.2 醫(yī)療保險中的保費欺詐行為挖掘 48
3.3 有組織犯罪行為挖掘 50
3.4 金融風控中團伙欺詐檢測 51
3.5 生命科學研究中的特異群組挖掘 52
3.6 流行病學調(diào)查中的密切接觸者發(fā)現(xiàn) 53
3.7 其他應用場景 53
3.8 小結(jié) 54
參考文獻 55
第4章 特異群組挖掘原理與框架 59
4.1 特異群組挖掘形式化描述 60
4.2 特異群組挖掘框架算法 63
4.3 實驗與結(jié)果分析 66
4.4 特異群組挖掘應用步驟 67
4.5 小結(jié) 68
參考文獻 69
第5章 相似性與相似性連接 71
5.1 相似性 72
5.2 相似性連接 74
5.3 相似性搜索中的索引結(jié)構(gòu) 77
5.4 異質(zhì)網(wǎng)絡上的自相似性連接 79
5.4.1 異質(zhì)信息網(wǎng)絡 79
5.4.2 異質(zhì)網(wǎng)絡上的相似性度量 83
5.4.3 基于路徑的自相似性連接 83
5.5 實驗與結(jié)果分析 90
5.5.1 效率分析 91
5.5.2 有效性分析 95
5.5.3 Topk相似連接示例 98
5.6 小結(jié) 101
參考文獻 101
第6章 無監(jiān)督的復雜行為數(shù)據(jù)表示學習 107
6.1 行為數(shù)據(jù) 108
6.2 表示學習 110
6.2.1 詞嵌入模型 110
6.2.2 圖嵌入模型 112
6.2.3 異質(zhì)網(wǎng)絡表示學習 116
6.2.4 知識圖譜表示學習 117
6.2.5 用戶-商品對表示學習 117
6.3 基于交互圖嵌入的復雜行為數(shù)據(jù)表示學習 118
6.3.1 交互圖定義 118
6.3.2 無屬性交互圖嵌入 122
6.3.3 IGE模型 124
6.4 實驗與結(jié)果分析 129
6.4.1 實驗描述 129
6.4.2 實驗結(jié)果分析 131
6.5 IGE算法在證券投資行為分析中的應用 135
6.6 小結(jié) 139
參考文獻 139
第7章 半監(jiān)督的復雜行為數(shù)據(jù)表示學習 147
7.1 圖半監(jiān)督學習 148
7.2 問題定義 150
7.3 算法模型 151
7.4 實驗與結(jié)果分析 153
7.4.1 實驗描述 153
7.4.2 實驗結(jié)果分析 154
7.5 小結(jié) 157
參考文獻 157
第8章 半監(jiān)督群組檢測 159
8.1 群組檢測 160
8.2 問題定義 162
8.3 算法模型 163
8.3.1 判別器 163
8.3.2 生成器 164
8.3.3 預訓練與強制教學 166
8.3.4 群組生成 167
8.4 實驗與結(jié)果分析 168
8.4.1 實驗描述 168
8.4.2 實驗結(jié)果分析 169
8.5 小結(jié) 170
參考文獻 170
第9章 增量復雜行為數(shù)據(jù)特征分析 173
9.1 問題定義 174
9.2 增量復雜行為數(shù)據(jù)特征表示算法 175
9.2.1 日交易記錄編碼 175
9.2.2 預測編碼 177
9.2.3 生成式對抗網(wǎng)絡 177
9.2.4 特征向量表示 178
9.3 方法應用與實驗分析:游資賬戶識別 179
9.3.1 業(yè)務問題定義 179
9.3.2 數(shù)據(jù)來源與預處理 181
9.3.3 游資賬戶識別 183
9.3.4 游資賬戶聚類 184
9.4 小結(jié) 185
參考文獻 185
第 10章 面向動態(tài)圖的節(jié)點表示學習 187
10.1 動態(tài)網(wǎng)絡節(jié)點嵌入 188
10.1.1 靜態(tài)網(wǎng)絡節(jié)點嵌入方法 190
10.1.2 單向量節(jié)點嵌入表示方法 191
10.1.3 多向量節(jié)點嵌入表示方法 192
10.1.4 函數(shù)式節(jié)點嵌入表示方法 193
10.2 問題定義 194
10.3 DynGraphGAN算法 195
10.3.1 生成器 197
10.3.2 判別器 198
10.3.3 算法細節(jié) 200
10.4 實驗與結(jié)果分析 201
10.4.1 數(shù)據(jù)集 201
10.4.2 基準算法 202
10.4.3 評估任務 203
10.4.4 鏈路重構(gòu)和鏈路預測分析 204
10.4.5 參數(shù)敏感性分析 207
10.5 小結(jié) 209
參考文獻 209
第 11章 多源網(wǎng)絡對齊 213
11.1 多源數(shù)據(jù)網(wǎng)絡 214
11.2 問題定義 216
11.3 HGANE算法 217
11.3.1 層次圖注意機制 217
11.3.2 對齊網(wǎng)絡表示 220
11.3.3 面向協(xié)同鏈接預測的網(wǎng)絡表示框架 222
11.4 實驗與結(jié)果分析 223
11.4.1 數(shù)據(jù)集 223
11.4.2 對比方法 224
11.4.3 實驗設置 225
11.4.4 實驗結(jié)果 226
11.4.5 假設驗證 227
11.4.6 參數(shù)分析 228
11.5 小結(jié) 230
參考文獻 230
第 12章 總結(jié)與展望 233
12.1 總結(jié) 234
12.2 展望 236

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號