注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡家庭與辦公軟件大數(shù)據(jù)分析方法

大數(shù)據(jù)分析方法

大數(shù)據(jù)分析方法

定 價:¥48.00

作 者: 陸紅 著
出版社: 中國財富出版社
叢編項:
標 簽: 暫缺

ISBN: 9787504764164 出版時間: 2017-04-01 包裝: 平裝
開本: 16開 頁數(shù): 160 字數(shù):  

內容簡介

  本書圍繞大數(shù)據(jù)分析方法,闡述了大數(shù)據(jù)采集方法,大數(shù)據(jù)清洗方法,詳細介紹了大數(shù)據(jù)存儲方法,大數(shù)據(jù)分布式計算方法,大數(shù)據(jù)分析模型構建方法,大數(shù)據(jù)分析模型檢驗方法,大數(shù)據(jù)分析模型優(yōu)化方法。全書提供了大量的案例,對程序進行了詳細的分析和解讀。本書的實用價值較高,對從事大數(shù)據(jù)分析的科研人員、研發(fā)人員具有一定的借鑒參考作用。

作者簡介

  陸紅,副教授,北京信息職業(yè)技術學院技術應用研究所所長,多年從事計算機領域研究,主要研究方向:大數(shù)據(jù)、人工智能、軟件技術。主持多項省部級課題,其中一項獲教育部科技成果獎。編寫多部著作,發(fā)表多篇相關領域的學術論文。作為多個部委專家,主持完成多個部委信息化建設標準制定工作。主持完成多個部委信息化建設項目。

圖書目錄

1大數(shù)據(jù)采集處理方法1
1.1爬蟲程序設計方案1
1.2爬蟲程序實現(xiàn)方法5
1.3數(shù)據(jù)清洗20
2大數(shù)據(jù)存儲方法27
2.1分布式文件系統(tǒng)存儲大數(shù)據(jù)27
2.1.1HDFS體系結構27
2.1.2HDFS數(shù)據(jù)存儲方式28
2.1.3HDFS讀寫方式28
2.2分布式數(shù)據(jù)庫存儲大數(shù)據(jù)32
2.2.1Hbase體系結構32
2.2.2配置Hbase33
2.2.3Hbase表操作38
2.2.4訪問Hbase數(shù)據(jù)資源44
3大數(shù)據(jù)計算方法50
3.1分布式計算平臺構建方法50
3.2分布式計算框架構建方法60
3.3分布式計算程序設計方法63
4大數(shù)據(jù)分析模型構建方法78
4.1準備訓練數(shù)據(jù)78
4.2機器學習路徑和算法設計方法82
4.3數(shù)據(jù)可視化輔助建模方法88
4.4構建大數(shù)據(jù)分析模型91
5大數(shù)據(jù)分析模型檢驗方法108
5.1回歸診斷108
5.2交叉驗證113
6大數(shù)據(jù)分析模型優(yōu)化方法117
6.1Feature Scaling優(yōu)化法117
6.2逐步回歸優(yōu)化法118
6.3PCA主成分分析優(yōu)化方法120
6.4神經(jīng)網(wǎng)絡優(yōu)化大數(shù)據(jù)分析模型127
參考文獻151

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號