注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡家庭與辦公軟件大數(shù)據(jù)處理:從采集到可視化

大數(shù)據(jù)處理:從采集到可視化

大數(shù)據(jù)處理:從采集到可視化

定 價:¥38.00

作 者: 余肖生,陳鵬,姜艷靜 著
出版社: 武漢大學出版社
叢編項: 高等學校信息管理學專業(yè)系列教材
標 簽: 暫缺

購買這本書可以去


ISBN: 9787307215146 出版時間: 2020-07-01 包裝: 平裝
開本: 16開 頁數(shù): 215 字數(shù):  

內(nèi)容簡介

  《大數(shù)據(jù)處理:從采集到可視化》共分為9章,章數(shù)據(jù)采集,主要介紹了大數(shù)據(jù)的概念、類型及其特征,常見的數(shù)據(jù)采集方法;第2章數(shù)據(jù)清洗,主要討論數(shù)據(jù)質(zhì)量的維度,數(shù)據(jù)可能存在的質(zhì)量問題,常見的數(shù)據(jù)清洗方法;第3章數(shù)據(jù)ETL,重點介紹了MGO方法;第4章數(shù)據(jù)存儲,主要介紹了大數(shù)據(jù)時代的一些主流數(shù)據(jù)存儲平臺和相關(guān)技術(shù);第5章回歸算法,主要介紹了線性回歸、決策樹回歸、隨機森林回歸等,并介紹了其實現(xiàn)的主要步驟以及相應的Python語言實現(xiàn)代碼;第6章分類算法,主要介紹了邏輯回歸二分類和多分類、度提升分類樹等;第7章聚類算法,主要介紹了分割聚類、層次聚類、基于密度的聚類;第8章推薦算法,主要介紹了基于關(guān)聯(lián)規(guī)則的推薦、基于內(nèi)容過濾的推薦等主流方法;第9章數(shù)據(jù)可視化的關(guān)鍵技術(shù),主要介紹了數(shù)據(jù)的降維、可視化隱喻及相關(guān)的交互技術(shù)。

作者簡介

  余肖生,博士,教授,三峽大學計算機學院教授,計算機學系書記,畢業(yè)于武漢大學信息管理學院。近年來發(fā)表各類學術(shù)論文30余篇,其中CSSCI源刊論文10余篇,多篇論文被EI、CPCI收錄。

圖書目錄

第1章 數(shù)據(jù)采集
1.1 大數(shù)據(jù)概念
1.2 大數(shù)據(jù)類型及特征
1.3 數(shù)據(jù)采集方法
1.3.1 問卷調(diào)查方法
1.3.2 網(wǎng)絡用戶數(shù)據(jù)收集方法
1.3.3 系統(tǒng)曰志采集方法
1.3.4 網(wǎng)絡數(shù)據(jù)采集方法
第2章 數(shù)據(jù)清洗
2.1 數(shù)據(jù)質(zhì)量維度
2.2 數(shù)據(jù)預處理之數(shù)據(jù)可能存在的問題
2.3 數(shù)據(jù)質(zhì)量問題的原因分析
2.3.1 數(shù)據(jù)源數(shù)據(jù)質(zhì)量問題的原因分析
2.3.2 數(shù)據(jù)分析階段數(shù)據(jù)質(zhì)量問題的原因分析
2.4 數(shù)據(jù)預處理之數(shù)據(jù)問題處理方法
2.4.1 變化量識別
2.4.2 錯誤拒絕
2.4.3 列清洗
2.4.4 行過濾
2.5 記錄匹配算法
……

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號