注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)實(shí)用數(shù)據(jù)分析

實(shí)用數(shù)據(jù)分析

實(shí)用數(shù)據(jù)分析

定 價(jià):¥59.00

作 者: Hector Cuesta 著
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 大數(shù)據(jù)技術(shù)叢書(shū)
標(biāo) 簽: 計(jì)算機(jī)與互聯(lián)網(wǎng) 數(shù)據(jù)庫(kù)

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787111476238 出版時(shí)間: 2014-09-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 335 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)共14章,主要內(nèi)容包括:第1章探討數(shù)據(jù)分析的基本原理和數(shù)據(jù)分析步驟。第2章解釋如何清洗并準(zhǔn)備好數(shù)據(jù)并介紹了數(shù)據(jù)清洗工具OpenRefine。第3章展示在JavaScript可視化框架下應(yīng)用D3.js語(yǔ)言來(lái)實(shí)現(xiàn)各類(lèi)數(shù)據(jù)的可視化方法。第4章介紹如何應(yīng)用樸素貝葉斯算法來(lái)區(qū)分垃圾郵件。第5章介紹了一個(gè)應(yīng)用動(dòng)態(tài)時(shí)間規(guī)整方法來(lái)尋找圖像間相似性的項(xiàng)目。第6章解釋如何使用隨機(jī)游走算法和可視化的D3.js動(dòng)畫(huà)技術(shù)來(lái)模擬股票價(jià)格。第7章介紹核嶺回歸(KRR)的原理以及如何使用此方法和時(shí)間序列數(shù)據(jù)來(lái)預(yù)測(cè)黃金價(jià)格。第8章描述如何使用支持向量機(jī)的方法進(jìn)行分類(lèi)分析。第9章應(yīng)用細(xì)胞自動(dòng)機(jī)的方法對(duì)傳染病進(jìn)行建模。第10章解釋如何應(yīng)用Gephi從Facebook獲取你的社會(huì)化媒體圖譜并使之實(shí)現(xiàn)可視化。第11章介紹如何應(yīng)用Twitter數(shù)據(jù)進(jìn)行情感分析。第12章介紹使用MongoDB進(jìn)行數(shù)據(jù)處理和聚合。第13章詳細(xì)介紹了如何在MongoDB數(shù)據(jù)庫(kù)中應(yīng)用MapReduce編程模型。第14章介紹如何應(yīng)用IPython和Wakari開(kāi)展線上數(shù)據(jù)分析。

作者簡(jiǎn)介

  Hector Cuesta,資深數(shù)據(jù)分析咨詢(xún)師,為金融服務(wù)、社會(huì)化網(wǎng)絡(luò)、在線學(xué)習(xí)和人力資源等多個(gè)行業(yè)提供軟件工程與數(shù)據(jù)分析方面的咨詢(xún)服務(wù)。他是墨西哥州自治大學(xué)計(jì)算機(jī)科學(xué)系的講師,主要研究領(lǐng)域涉及計(jì)算流行病學(xué)、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)、高性能計(jì)算、大數(shù)據(jù)、模擬和數(shù)據(jù)可視化。他是《Software Guru》雜志的專(zhuān)欄作家,并且在一些國(guó)際期刊和會(huì)議中發(fā)表多篇科學(xué)論文。業(yè)余時(shí)間,他是樂(lè)高機(jī)器人和樹(shù)莓派的狂熱愛(ài)好者。

圖書(shū)目錄

Preface前言
本書(shū)提供了一系列現(xiàn)實(shí)中將數(shù)據(jù)轉(zhuǎn)化為洞察力的案例。書(shū)中覆蓋了廣泛的數(shù)據(jù)分析工具和算法,用于進(jìn)行分類(lèi)分析、聚類(lèi)分析、數(shù)據(jù)可視化、數(shù)據(jù)模擬以及預(yù)測(cè)。本書(shū)的目標(biāo)是幫助你了解數(shù)據(jù)從而找到相應(yīng)的模式、趨勢(shì)、相互關(guān)系以及洞察力。
書(shū)中所包括的實(shí)用項(xiàng)目充分利用了MongoDB、D3.js和Python語(yǔ)言并采用代碼片段和詳細(xì)描述的方式向讀者呈現(xiàn)本書(shū)的核心概念。
本書(shū)組織結(jié)構(gòu)
第1章探討數(shù)據(jù)分析的基本原理和數(shù)據(jù)分析步驟。
第2章解釋如何清洗并準(zhǔn)備好數(shù)據(jù)來(lái)開(kāi)展分析,同時(shí)介紹了數(shù)據(jù)清洗工具OpenRefine的使用方式。
第3章展示在JavaScript可視化框架下應(yīng)用D3.js語(yǔ)言來(lái)實(shí)現(xiàn)各類(lèi)數(shù)據(jù)的可視化方法。
第4章介紹了應(yīng)用樸素貝葉斯算法(Na?ve Bayes)來(lái)區(qū)分垃圾文本的一種二元分類(lèi)法。
第5章展示了一個(gè)應(yīng)用動(dòng)態(tài)時(shí)間規(guī)整方法來(lái)尋找圖像間相似性的項(xiàng)目。
第6章解釋了如何使用隨機(jī)游走算法和可視化的D3.js動(dòng)畫(huà)技術(shù)來(lái)模擬股票價(jià)格的內(nèi)容。
第7章介紹核嶺回歸(Kernel Ridge Regression,KRR)的原理以及如何使用此方法和時(shí)間序列數(shù)據(jù)來(lái)預(yù)測(cè)黃金價(jià)格。
第8章描述如何使用支持向量機(jī)的方法進(jìn)行分類(lèi)分析。
第9章介紹了對(duì)流行病進(jìn)行模擬計(jì)算的基本概念并解釋如何應(yīng)用細(xì)胞自動(dòng)機(jī)方法、D3.js和JavaScript語(yǔ)言來(lái)實(shí)現(xiàn)對(duì)流行病爆發(fā)的模擬。
第10章解釋如何應(yīng)用Gephi從Facebook獲取你的社會(huì)化媒體圖譜并使之實(shí)現(xiàn)可視化。
第11章解釋如何應(yīng)用Twitter的應(yīng)用程序編程接口(API)來(lái)獲取Twitter的數(shù)據(jù)。讀者也將看到如何改進(jìn)文本分類(lèi)分析方法并將其應(yīng)用于情感分析。這一過(guò)程是在自然語(yǔ)言工具包(Natural Language Toolkit, NLTK)中應(yīng)用了樸素貝葉斯算法。
第12章介紹在MongoDB數(shù)據(jù)庫(kù)中進(jìn)行基本操作以及進(jìn)行分組、過(guò)濾和聚合的方法。
第13章詳細(xì)介紹如何在MongoDB數(shù)據(jù)庫(kù)中應(yīng)用MapReduce編程模型。
第14章解釋了如何使用Wakari平臺(tái),同時(shí)介紹了IPython中運(yùn)用Pandas進(jìn)行數(shù)據(jù)處理和使用PIL圖像處理庫(kù)的方法。
附錄提供書(shū)中所使用的軟件工具的詳細(xì)安裝信息。
本書(shū)技能要求

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)