注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡(luò)家庭與辦公軟件大數(shù)據(jù)分布式計算與案例

大數(shù)據(jù)分布式計算與案例

大數(shù)據(jù)分布式計算與案例

定 價:¥29.00

作 者: 李豐
出版社: 中國人民大學出版社
叢編項: 大數(shù)據(jù)分析統(tǒng)計應(yīng)用叢書
標 簽: 計算機/網(wǎng)絡(luò) 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 數(shù)據(jù)庫

ISBN: 9787300230276 出版時間: 2016-07-01 包裝: 平裝
開本: 16 頁數(shù): 148 字數(shù):  

內(nèi)容簡介

  大數(shù)據(jù)分布式計算課程是大數(shù)據(jù)方向應(yīng)用統(tǒng)計專業(yè)碩士學生的專業(yè)必修課,通過本課程的學習使學生能夠掌握目前大數(shù)據(jù)挖掘領(lǐng)域常用的并行計算方法,加深學生對統(tǒng)計并行計算的理解,培養(yǎng)學生使用在現(xiàn)代并行架構(gòu)下利用統(tǒng)計方法深入挖掘大數(shù)據(jù)中的數(shù)據(jù)結(jié)構(gòu)并能解決一些實際問題的能力。

作者簡介

  李豐 中央財經(jīng)大學統(tǒng)計與數(shù)學學院碩士生導(dǎo)師,院長助理。瑞典斯德哥爾摩大學統(tǒng)計學系統(tǒng)計學博士。研究方向與興趣:大數(shù)據(jù)與復(fù)雜模型、貝葉斯推斷與統(tǒng)計計算、計量經(jīng)濟與預(yù)測方法、多元模型等。曾獲國際貝葉斯協(xié)會青年旅行獎勵、瑞典Knut and Alice Wallenberg 基金會獎勵。任中國統(tǒng)計教育學會高等教育分會副秘書長。金融工程與風險管理國際研討會執(zhí)行秘書等。

圖書目錄

目錄第1章 統(tǒng)計分析與并行計算1.1 并行計算與并行計算機1.2 統(tǒng)計計算的并行原理||以矩陣乘法為例1.3 基于R 的單機并行計算 1.4 基于Python 的單機并行計算 1.5 大數(shù)據(jù)背景下的數(shù)據(jù)采集和存儲 1.6 參考文獻 第2章 Hadoop 基礎(chǔ) 2.1 Hadoop 歷史、生態(tài)系統(tǒng) 2.2 Hadoop 的分布式文件系統(tǒng)(HDFS) 2.3 MapReduce 工作原理 2.4 Hadoop 上運行MapReduce 2.5 MapReduce 實例: 分層隨機抽樣 2.6 MapReduce 實例: 聚類分析 2.7 參考文獻 第3章 基于Hadoop 的分布式算法和模型實現(xiàn) 3.1 R 中實現(xiàn)Hadoop 分布式計算 3.2 Mahout 與大數(shù)據(jù)機器學習 3.3 利用Mahout 進行數(shù)據(jù)挖掘 3.4 Mahout 實例: Logistics 回歸和隨機森林分類算法 3.5 Mahout 實例: 隨機森林的分布式實現(xiàn) 3.6 參考文獻 第4章 統(tǒng)計模型的MapReduce 實現(xiàn)詳解 4.1 泊松回歸模型: 付費搜索廣告分析 4.2 判別分析: 氣象因素對霧霾影響分析 4.3 分塊Logistics 回歸 4.4 文本分類 4.5 樸素貝葉斯模型 4.6 嶺回歸模型 4.7 推薦系統(tǒng) 4.8 參考文獻 第5章 分布式文件訪問與計算 5.1 Hive 基礎(chǔ) 5.2 HiveQL 數(shù)據(jù)定義(DDL) 5.3 HBase 5.4 Hive 實例: FoodMart 案例 5.5 Hive 實例: Hive Streaming 交互計算 5.6 參考文獻 第6章 Spark 與統(tǒng)計模型 6.1 Spark 簡介 6.2 Spark 工作原理介紹 6.3 Pyspark 命令介紹 6.4 Spark 實例: 通過Word Count 了解Spark 工作流程 6.5 Spark 實例: 二分類學習 6.6 Spark 實例: 決策樹模型 6.7 參考文獻 附錄A Hadoop 安裝運行 A.1 單機偽分布式安裝 A.2 全分布式集群 附錄B Mahout 安裝與運行 附錄C Hive 安裝運行 C.1 準備 C.2 安裝Hive C.3 配置Hive 附錄D HBase 安裝運行 D.1 安裝配置HBase D.2 啟動HBase

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號