注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術工業(yè)技術自動化技術、計算技術大數(shù)據(jù)、數(shù)據(jù)挖掘與智慧運營

大數(shù)據(jù)、數(shù)據(jù)挖掘與智慧運營

大數(shù)據(jù)、數(shù)據(jù)挖掘與智慧運營

定 價:¥99.00

作 者: 梁棟,張兆靜,彭木根 著
出版社: 清華大學出版社
叢編項:
標 簽: >計算機/網(wǎng)絡 >數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 >數(shù)據(jù)庫

ISBN: 9787302483373 出版時間: 2017-10-01 包裝: 平裝
開本: 16開 頁數(shù): 403 字數(shù):  

內容簡介

  本書系統(tǒng)地介紹了大數(shù)據(jù)挖掘的基本概念、經典挖掘算法、挖掘工具和企業(yè)智慧運營應用案例。全書分為9章,內容包括:大數(shù)據(jù)挖掘與智慧運營的概念,數(shù)據(jù)預處理,數(shù)據(jù)挖掘中的四種主流算法:聚類分析、分類分析、回歸分析、關聯(lián)分析,增強型數(shù)據(jù)挖掘算法,數(shù)據(jù)挖掘在運營商智慧運營中的應用案例,未來大數(shù)據(jù)挖掘的發(fā)展趨勢等。全書以運用大數(shù)據(jù)挖掘方法提升企業(yè)運營業(yè)績與效率為主線,從運營商實際工作中選取了大量運營和銷售案例,詳細講述了數(shù)據(jù)采集、挖掘建模、模型落地與精準營銷的全部過程。書中大部分案例的代碼、軟件操作流程和微課視頻可以通過掃描本書封底的二維碼下載。本書主要面向運營商及其他高科技企業(yè)員工、高等院校相關專業(yè)本科生和研究生,以及其他對數(shù)據(jù)挖掘與精準營銷感興趣的讀者。

作者簡介

  梁棟,博士畢業(yè)于北京郵電大學信號與系統(tǒng)專業(yè),現(xiàn)任教于北京郵電大學,碩士研究生導師,曾主持和參加多項國家自然科學基金項目、國家863課題項目、國家973科技項目和多項省部級科研項目,主要研究方向為大數(shù)據(jù)、數(shù)據(jù)挖掘與智慧運營,所帶領的研究團隊在包括IEEE Internet of things Journal、IEEE International Conference on Data Mining等著名學術期刊和會議上發(fā)表高水平學術論文20多篇,并且長期與中國移動等運營商企業(yè)進行科技產業(yè)化合作,在大數(shù)據(jù)、數(shù)據(jù)挖掘技術運用于企業(yè)智慧化運營方面有著豐富的落地經驗。

圖書目錄

第1章大數(shù)據(jù)、數(shù)據(jù)挖掘與智慧運營綜述1
1.1數(shù)據(jù)挖掘的發(fā)展史2
1.1.1數(shù)據(jù)挖掘的定義與起源2
1.1.2數(shù)據(jù)挖掘的早期發(fā)展3
1.1.3數(shù)據(jù)挖掘的算法前傳4
1.1.4數(shù)據(jù)挖掘的第一個里程碑8
1.1.5最近十年的發(fā)展與應用11
1.2數(shù)據(jù)挖掘的主要流程與金字塔模型13
1.2.1數(shù)據(jù)挖掘的任務14
1.2.2數(shù)據(jù)挖掘的基本步驟16
1.2.3數(shù)據(jù)挖掘的架構——云計算17
1.2.4“金字塔”模型20
1.3數(shù)據(jù)挖掘對智慧運營的意義22
1.3.1“互聯(lián)網(wǎng)+”時代的來臨及其對運營商的沖擊和挑戰(zhàn)22
1.3.2大數(shù)據(jù)時代的來臨及其對運營商的挑戰(zhàn)和機遇24
1.3.3電信運營商運營發(fā)展面臨的主要瓶頸26
1.3.4電信運營商發(fā)展的“三條曲線”27
1.3.5智慧運營與大數(shù)據(jù)變現(xiàn)29
1.3.6數(shù)據(jù)挖掘對于提升智慧運營效率的意義30
1.4大數(shù)據(jù)時代已經來臨31
1.4.1大數(shù)據(jù)的定義31
1.4.2大數(shù)據(jù)的“4V”特征32
1.4.3結構化數(shù)據(jù)與非結構化數(shù)據(jù)33
1.5非結構化數(shù)據(jù)挖掘的研究進展34
1.5.1文本挖掘34
1.5.2模式識別36
1.5.3語音識別40
1.5.4視頻識別44
1.5.5其他非結構化數(shù)據(jù)挖掘48
1.6數(shù)據(jù)挖掘與機器學習、深度學習、人工智能及云計算50
1.6.1機器學習51
1.6.2深度學習53
1.6.3人工智能55
1.6.4云計算56
1.7現(xiàn)有數(shù)據(jù)挖掘的主要分析軟件與系統(tǒng)61
1.7.1Hadoop61
1.7.2Storm63
1.7.3Spark65
1.7.4SPASS(SPSS)66
1.7.5SAS68
參考文獻70
第2章數(shù)據(jù)統(tǒng)計與數(shù)據(jù)預處理73
2.1數(shù)據(jù)屬性類型74
2.1.1數(shù)據(jù)屬性定義74
2.1.2離散屬性74
2.1.3連續(xù)屬性75
2.2數(shù)據(jù)的統(tǒng)計特性77
2.2.1中心趨勢度量77
2.2.2數(shù)據(jù)散布度量78
2.2.3數(shù)據(jù)相關性82
2.3數(shù)據(jù)預處理87
2.3.1數(shù)據(jù)預處理概述87
3.6基于網(wǎng)格的聚類:CLIQUE140
3.6.1基于網(wǎng)格的聚類算法概述140
3.6.2CLIQUE算法的基本原理141
3.6.3CLIQUE算法的優(yōu)勢與劣勢142
參考文獻143
第4章分類分析145
4.1分類分析概述146
4.2分類分析的評估148
4.3決策樹分析152
4.3.1決策樹算法的基本原理152
4.3.2CHAID決策樹160
4.3.3ID3決策樹167
4.3.4C4.5決策樹171
4.3.5CART決策樹175
4.3.6決策樹中的剪枝問題179
4.3.7決策樹在SPSS中的應用180
4.4最近鄰分析(KNN)185
4.4.1KNN算法的基本原理185
4.4.2KNN算法流程186
4.4.3KNN算法的若干問題187
4.4.4KNN分類器的特征188
4.4.5KNN算法在SPSS中的應用188
4.5貝葉斯分析191
4.5.1貝葉斯定理191
4.5.2樸素貝葉斯分類192
4.5.3貝葉斯網(wǎng)絡195
4.6神經網(wǎng)絡199
4.6.1感知器200
4.6.2多重人工神經網(wǎng)絡201
4.6.3人工神經網(wǎng)絡的特點203
4.7支持向量機204
第6章關聯(lián)分析245
6.1關聯(lián)分析概述246
6.2關聯(lián)分析的評估指標247
6.2.1支持度247
6.2.2置信度248
6.2.3算法復雜度248
6.3Apriori算法249
6.3.1頻繁項集的定義與產生249
6.3.2先驗原理251
6.3.3基于支持度的計數(shù)與剪枝252
6.3.4候選項集生成253
6.3.5基于置信度的剪枝259
6.3.6Apriori算法規(guī)則生成259
6.4FP-tree算法261
6.4.1頻繁模式樹261
6.4.2FP-tree算法頻繁項集的產生263
6.4.3FP-tree算法規(guī)則生成263
6.4.4算法性能對比與評估264
6.5SPSSModeler關聯(lián)分析實例265
參考文獻269
第7章增強型數(shù)據(jù)挖掘算法271
7.1增強型數(shù)據(jù)挖掘算法概述272
7.1.1組合方法的優(yōu)勢272
7.1.2構建組合分類器的方法272
7.2隨機森林273
7.2.1隨機森林的原理273
7.2.2隨機森林的優(yōu)缺點276
7.2.3隨機森林的泛化誤差276
7.2.4輸入特征的選擇方法277
7.3Bagging算法277

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號