注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件大數(shù)據(jù)分析:數(shù)據(jù)挖掘必備算法示例詳解

大數(shù)據(jù)分析:數(shù)據(jù)挖掘必備算法示例詳解

大數(shù)據(jù)分析:數(shù)據(jù)挖掘必備算法示例詳解

定 價(jià):¥39.90

作 者: 張重生 著
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787111555469 出版時(shí)間: 2016-12-01 包裝: 平裝
開本: 16k 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書詳細(xì)介紹了大數(shù)據(jù)分析,尤其是數(shù)據(jù)分類相關(guān)算法的原理及實(shí)現(xiàn)細(xì)節(jié),并給出了每個(gè)算法的編程實(shí)例。全書共計(jì)21章,內(nèi)容包括十大數(shù)據(jù)分類算法、十大從二元分類到多類分類的算法、九大屬性選擇算法、五大數(shù)據(jù)選擇算法,若干集成學(xué)習(xí)方法和不均衡數(shù)據(jù)分類算法,以及大數(shù)據(jù)分析的平臺(tái)與技術(shù)。 本書可作為高等學(xué)校計(jì)算機(jī)科學(xué)與技術(shù)、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)、統(tǒng)計(jì)學(xué)、軟件工程、地理信息系統(tǒng)等專業(yè)的研究生和高年級(jí)本科生的教材,也可作為科研人員、工程師和大數(shù)據(jù)愛好者的參考書。

作者簡(jiǎn)介

  張重生,男,博士,教授,碩士生導(dǎo)師,河南大學(xué)大數(shù)據(jù)團(tuán)隊(duì)帶頭人。研究領(lǐng)域?yàn)榇髷?shù)據(jù)分析、深度學(xué)習(xí)、數(shù)據(jù)挖掘、數(shù)據(jù)庫(kù)、實(shí)時(shí)數(shù)據(jù)分析。博士畢業(yè)于 INRIA,F(xiàn)rance(法國(guó)國(guó)家信息與自動(dòng)化研究所)。2010年08月至2011年3月,在美國(guó)加州大學(xué)洛杉磯分校(UCLA)計(jì)算機(jī)系,師從Carlo Zaniolo教授進(jìn)行流數(shù)據(jù)挖掘方面的研究。 十多年來,一直從事數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘、大數(shù)據(jù)分析相關(guān)的研究,發(fā)表SCI/EI論文20篇,含Information Sciences、Neurocomputing、IEEE ICDM、PAKDD、SSDBM等國(guó)際期刊和會(huì)議論文。作為項(xiàng)目負(fù)責(zé)人主持 4項(xiàng)科研項(xiàng)目,出版學(xué)術(shù)專著3部,獲得3項(xiàng)國(guó)家發(fā)明專利,指導(dǎo)碩士研究生12名。

圖書目錄

第1章數(shù)據(jù)分析緒論
1.1理解數(shù)據(jù)中字段的類型是數(shù)據(jù)分析的重要前提
1.2進(jìn)行數(shù)據(jù)分析時(shí)數(shù)據(jù)的表示形式
1.3數(shù)據(jù)分類——數(shù)據(jù)類別的自動(dòng)識(shí)別
1.4數(shù)據(jù)分類問題與回歸問題的區(qū)別與聯(lián)系
1.5數(shù)據(jù)分析算法簡(jiǎn)介
1.6交叉驗(yàn)證
1.7一個(gè)最簡(jiǎn)單的分類器-K近鄰分類器
1.8后續(xù)章節(jié)組織
第2章SVM算法
2.1算法原理
2.2工具包簡(jiǎn)介
2.3實(shí)例詳解
第3章決策樹算法
3.1信息熵值
3.2決策樹的構(gòu)建目標(biāo)
3.3 ID3決策樹算法
3.4 C45決策樹算法
3.5 CART決策樹算法
3.6 ID3、C45、CART算法的終止條件
3.7C45算法的參數(shù)介紹
3.8實(shí)例詳解
第4章隨機(jī)森林算法
4.1算法原理
4.2工具包介紹
4.3實(shí)例詳解
第5章梯度提升決策樹算法
5.1算法原理
5.2工具包介紹
5.3實(shí)例詳解
第6章AdaBoost算法
6.1算法原理
6.2工具包介紹
6.3實(shí)例詳解
第7章樸素貝葉斯分類器
7.1樸素貝葉斯分類的問題定義
7.2樸素貝葉斯算法原理
7.3一種常見的樸素貝葉斯模型的錯(cuò)誤計(jì)算方法
7.4樸素貝葉斯算法對(duì)連續(xù)型屬性的處理
第8章極限學(xué)習(xí)機(jī)器算法
8.1算法原理
8.2算法參數(shù)介紹
8.3實(shí)例詳解
第9章邏輯回歸算法
9.1 Logistic Regression算法流程
9.2 Logistic Regression算法原理推導(dǎo)
第10章稀疏表示分類算法
10.1算法原理
10.2 SRC工具包及算法參數(shù)介紹
10.3 SRC算法實(shí)例詳解
第11章不同數(shù)據(jù)分類算法性能的大規(guī)模實(shí)驗(yàn)對(duì)比分析
11.1為什么要比較不同數(shù)據(jù)分類算法的性能?
11.2不同數(shù)據(jù)分類算法性能比較的相關(guān)工作
11.3最新數(shù)據(jù)分類算法性能的大規(guī)模實(shí)驗(yàn)對(duì)比分析結(jié)果
11.4結(jié)論
第12章從二分類到多分類——OVA
12.1 OVA 聚合規(guī)則的核心思想
12.2 MAX聚合規(guī)則
12.3 DOO聚合規(guī)則
12.4調(diào)用示例
第13章從二分類到多分類——OVO
13.1 OVO 聚合規(guī)則的核心思想
13.2 WV聚合規(guī)則
13.3 VOTE聚合規(guī)則
13.4 PC聚合規(guī)則
13.5 PE聚合規(guī)則
13.6 LVPC聚合規(guī)則
13.7調(diào)用示例
第14章從二分類到多分類——ECOC
14.1 ECOC的核心思想
14.2 ECOC 編碼
14.3 ECOC 譯碼
14.4 ECOC多類分類調(diào)用示例
第15章三種從二分類到多分類聚合策略的實(shí)驗(yàn)對(duì)比分析
15.1 OVA策略的實(shí)驗(yàn)結(jié)果
15.2 OVO策略的實(shí)驗(yàn)結(jié)果
15.3 ECOC策略的實(shí)驗(yàn)結(jié)果
第16章多個(gè)分類算法的集成方法研究
16.1差異性(Diversity)的原理與技術(shù)
16.2集成學(xué)習(xí)方法
16.3本章小結(jié)
第17章屬性選擇算法
17.1 fspackage和LibSVM的使用
17.2信息增益算法
17.3卡方分布算法
17.4基于Fisher Score的屬性選擇算法
17.5基于基厄系數(shù)的屬性選擇算法
17.6基于T檢驗(yàn)的屬性選擇算法
第18章高級(jí)屬性選擇算法
18.1線性前向選擇算法
18.2順序前向選擇算法
18.3基于稀疏多項(xiàng)式邏輯回歸的屬性選擇算法
18.4 Our——多個(gè)屬性選擇算法的集成策略
18.5屬性選擇算法的大規(guī)模實(shí)驗(yàn)對(duì)比分析
第19章數(shù)據(jù)選擇算法
19.1衡量不均衡數(shù)據(jù)分類質(zhì)量的常用方法
19.2 RUS算法
19.3 CNN算法
19.4 SMOTE算法
19.5 ADASYN算法
19.6 OSS算法
19.7本章小結(jié)
第20章不均衡數(shù)據(jù)分類算法及大規(guī)模實(shí)驗(yàn)分析
20.1 C4.5 CS算法
20.2使用Random Forests和GBDT進(jìn)行不均衡數(shù)據(jù)分類
20.3BalanceCascade不均衡數(shù)據(jù)分類算法
20.4其他不均衡數(shù)據(jù)分類算法及不均衡分類器的集成算法
20.5結(jié)合屬性選擇和數(shù)據(jù)選擇的不均衡數(shù)據(jù)分類實(shí)驗(yàn)
第21章大數(shù)據(jù)分析
21.1 Spark平臺(tái)簡(jiǎn)介
21.2基于Ambari的Spark及Spark集群的安裝與配置
21.3 Ambari集群擴(kuò)展
21.4基于Spark平臺(tái)的分布式編程示例
21.5 MLlib——Spark平臺(tái)上的機(jī)器學(xué)習(xí)庫(kù)


本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)