注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡數(shù)據(jù)庫實用數(shù)據(jù)分析

實用數(shù)據(jù)分析

實用數(shù)據(jù)分析

定 價:¥59.00

作 者: Hector Cuesta 著
出版社: 機械工業(yè)出版社
叢編項: 大數(shù)據(jù)技術叢書
標 簽: 計算機與互聯(lián)網(wǎng) 數(shù)據(jù)庫

ISBN: 9787111476238 出版時間: 2014-09-01 包裝: 平裝
開本: 16開 頁數(shù): 335 字數(shù):  

內(nèi)容簡介

  本書共14章,主要內(nèi)容包括:第1章探討數(shù)據(jù)分析的基本原理和數(shù)據(jù)分析步驟。第2章解釋如何清洗并準備好數(shù)據(jù)并介紹了數(shù)據(jù)清洗工具OpenRefine。第3章展示在JavaScript可視化框架下應用D3.js語言來實現(xiàn)各類數(shù)據(jù)的可視化方法。第4章介紹如何應用樸素貝葉斯算法來區(qū)分垃圾郵件。第5章介紹了一個應用動態(tài)時間規(guī)整方法來尋找圖像間相似性的項目。第6章解釋如何使用隨機游走算法和可視化的D3.js動畫技術來模擬股票價格。第7章介紹核嶺回歸(KRR)的原理以及如何使用此方法和時間序列數(shù)據(jù)來預測黃金價格。第8章描述如何使用支持向量機的方法進行分類分析。第9章應用細胞自動機的方法對傳染病進行建模。第10章解釋如何應用Gephi從Facebook獲取你的社會化媒體圖譜并使之實現(xiàn)可視化。第11章介紹如何應用Twitter數(shù)據(jù)進行情感分析。第12章介紹使用MongoDB進行數(shù)據(jù)處理和聚合。第13章詳細介紹了如何在MongoDB數(shù)據(jù)庫中應用MapReduce編程模型。第14章介紹如何應用IPython和Wakari開展線上數(shù)據(jù)分析。

作者簡介

  Hector Cuesta,資深數(shù)據(jù)分析咨詢師,為金融服務、社會化網(wǎng)絡、在線學習和人力資源等多個行業(yè)提供軟件工程與數(shù)據(jù)分析方面的咨詢服務。他是墨西哥州自治大學計算機科學系的講師,主要研究領域涉及計算流行病學、機器學習、計算機視覺、高性能計算、大數(shù)據(jù)、模擬和數(shù)據(jù)可視化。他是《Software Guru》雜志的專欄作家,并且在一些國際期刊和會議中發(fā)表多篇科學論文。業(yè)余時間,他是樂高機器人和樹莓派的狂熱愛好者。

圖書目錄

Preface前言
本書提供了一系列現(xiàn)實中將數(shù)據(jù)轉(zhuǎn)化為洞察力的案例。書中覆蓋了廣泛的數(shù)據(jù)分析工具和算法,用于進行分類分析、聚類分析、數(shù)據(jù)可視化、數(shù)據(jù)模擬以及預測。本書的目標是幫助你了解數(shù)據(jù)從而找到相應的模式、趨勢、相互關系以及洞察力。
書中所包括的實用項目充分利用了MongoDB、D3.js和Python語言并采用代碼片段和詳細描述的方式向讀者呈現(xiàn)本書的核心概念。
本書組織結(jié)構(gòu)
第1章探討數(shù)據(jù)分析的基本原理和數(shù)據(jù)分析步驟。
第2章解釋如何清洗并準備好數(shù)據(jù)來開展分析,同時介紹了數(shù)據(jù)清洗工具OpenRefine的使用方式。
第3章展示在JavaScript可視化框架下應用D3.js語言來實現(xiàn)各類數(shù)據(jù)的可視化方法。
第4章介紹了應用樸素貝葉斯算法(Na?ve Bayes)來區(qū)分垃圾文本的一種二元分類法。
第5章展示了一個應用動態(tài)時間規(guī)整方法來尋找圖像間相似性的項目。
第6章解釋了如何使用隨機游走算法和可視化的D3.js動畫技術來模擬股票價格的內(nèi)容。
第7章介紹核嶺回歸(Kernel Ridge Regression,KRR)的原理以及如何使用此方法和時間序列數(shù)據(jù)來預測黃金價格。
第8章描述如何使用支持向量機的方法進行分類分析。
第9章介紹了對流行病進行模擬計算的基本概念并解釋如何應用細胞自動機方法、D3.js和JavaScript語言來實現(xiàn)對流行病爆發(fā)的模擬。
第10章解釋如何應用Gephi從Facebook獲取你的社會化媒體圖譜并使之實現(xiàn)可視化。
第11章解釋如何應用Twitter的應用程序編程接口(API)來獲取Twitter的數(shù)據(jù)。讀者也將看到如何改進文本分類分析方法并將其應用于情感分析。這一過程是在自然語言工具包(Natural Language Toolkit, NLTK)中應用了樸素貝葉斯算法。
第12章介紹在MongoDB數(shù)據(jù)庫中進行基本操作以及進行分組、過濾和聚合的方法。
第13章詳細介紹如何在MongoDB數(shù)據(jù)庫中應用MapReduce編程模型。
第14章解釋了如何使用Wakari平臺,同時介紹了IPython中運用Pandas進行數(shù)據(jù)處理和使用PIL圖像處理庫的方法。
附錄提供書中所使用的軟件工具的詳細安裝信息。
本書技能要求

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號