注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件Storm技術(shù)內(nèi)幕與大數(shù)據(jù)實(shí)踐

Storm技術(shù)內(nèi)幕與大數(shù)據(jù)實(shí)踐

Storm技術(shù)內(nèi)幕與大數(shù)據(jù)實(shí)踐

定 價(jià):¥49.00

作 者: 陳敏敏 等著
出版社: 人民郵電出版社
叢編項(xiàng):
標(biāo) 簽: 計(jì)算機(jī)/網(wǎng)絡(luò) 軟件工程/開發(fā)項(xiàng)目管理

ISBN: 9787115388537 出版時(shí)間: 2015-05-01 包裝:
開本: 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  《Storm技術(shù)內(nèi)幕與大數(shù)據(jù)實(shí)踐》內(nèi)容主要圍繞實(shí)時(shí)大數(shù)據(jù)系統(tǒng)的各個(gè)方面展開,從實(shí)時(shí)平臺(tái)總體介紹到集群源碼、運(yùn)維監(jiān)控、實(shí)時(shí)系統(tǒng)擴(kuò)展、以用戶畫像為主的數(shù)據(jù)平臺(tái),最后到推薦、廣告、搜索等具體的大數(shù)據(jù)應(yīng)用。書中提到的不少問題是實(shí)際生產(chǎn)環(huán)境中因?yàn)閿?shù)據(jù)量增長而遇到的一些真實(shí)問題,對(duì)即將或正在運(yùn)用實(shí)時(shí)系統(tǒng)處理大數(shù)據(jù)問題的團(tuán)隊(duì)會(huì)有所幫助。

作者簡介

  陳敏敏 1號(hào)店個(gè)性精準(zhǔn)化部門資深架構(gòu)師,在此之前曾服務(wù)于微軟和三星電子等公司,長期從事大數(shù)據(jù)、搜索和推薦平臺(tái)相關(guān)工作。目前主要關(guān)注于NoSQL、實(shí)時(shí)計(jì)算框架、推薦、廣告投放等相關(guān)技術(shù)。王新春 大眾點(diǎn)評(píng)網(wǎng)數(shù)據(jù)平臺(tái)資深工程師,負(fù)責(zé)點(diǎn)評(píng)實(shí)時(shí)計(jì)算平臺(tái)相關(guān)工作,推動(dòng)流式計(jì)算和實(shí)時(shí)計(jì)算在點(diǎn)評(píng)的應(yīng)用和推廣,一直致力于大數(shù)據(jù)和分布式系統(tǒng)的研究和應(yīng)用。目前主要從事NoSQL、實(shí)時(shí)分布式系統(tǒng)的研究與開發(fā)。黃奉線 1號(hào)店基礎(chǔ)架構(gòu)部分布式存儲(chǔ)團(tuán)隊(duì)負(fù)責(zé)人,推動(dòng)流式計(jì)算在1號(hào)店的應(yīng)用,獲得CTO特別獎(jiǎng),長期從事基礎(chǔ)架構(gòu)相關(guān)工作。目前主要關(guān)注于NoSQL、開源、流式計(jì)算、分布式存儲(chǔ)等相關(guān)技術(shù)。

圖書目錄

第1章 緒論
 1.1 Storm的基本組件
  1.1.1 集群組成
  1.1.2 核心概念
  1.1.3 Storm的可靠性
  1.1.4 Storm的特性
 1.2 其他流式處理框架
  1.2.1 Apache S4
  1.2.2 Spark Streaming
  1.2.3 流計(jì)算和Storm的應(yīng)用
第2章 實(shí)時(shí)平臺(tái)介紹
 2.1 實(shí)時(shí)平臺(tái)架構(gòu)介紹
 2.2 Kafka架構(gòu)
  2.2.1 Kafka的基本術(shù)語和概念
  2.2.2 Kafka在實(shí)時(shí)平臺(tái)中的應(yīng)用
  2.2.3 消息的持久化和順序讀寫
  2.2.4 sendfile系統(tǒng)調(diào)用和零復(fù)制
  2.2.5 Kafka的客戶端
  2.2.6 Kafka的擴(kuò)展
 2.3 大眾點(diǎn)評(píng)實(shí)時(shí)平臺(tái)
  2.3.1 相關(guān)數(shù)據(jù)
  2.3.2 實(shí)時(shí)平臺(tái)簡介
  2.3.3 Blackhole
 2.4 1號(hào)店實(shí)時(shí)平臺(tái)
第3章 Storm集群部署和配置
 3.1 Storm的依賴組件
 3.2 Storm的部署環(huán)境
 3.3 部署Storm服務(wù)
  3.3.1 部署ZooKeeper
  3.3.2 部署Storm
  3.3.3 配置Storm
 3.4 啟動(dòng)Storm
 3.5 Storm的守護(hù)進(jìn)程
 3.6 部署Storm的其他節(jié)點(diǎn)
 3.7 提交Topology
第4章 Storm內(nèi)部剖析
 4.1 Storm客戶端
 4.2 Nimbus
  4.2.1 啟動(dòng)Nimbus服務(wù)
  4.2.2 Nimbus服務(wù)的執(zhí)行過程
  4.2.3 分配Executor
  4.2.4 調(diào)度器
  4.2.5 默認(rèn)調(diào)度器DefaultScheduler
  4.2.6 均衡調(diào)度器EvenScheduler
 4.3 Supervisor
  4.3.1 ISupervisor接口
  4.3.2 Supervisor的共享數(shù)據(jù)
  4.3.3 Supervisor的執(zhí)行過程
 4.4 Worker
  4.4.1 Worker中的數(shù)據(jù)流
  4.4.2 創(chuàng)建Worker的過程
 4.5 Executor
  4.5.1 Executor的創(chuàng)建
  4.5.2 創(chuàng)建Spout的Executor
  4.5.3 創(chuàng)建Bolt的Executor
 4.6 Task
  4.6.1 Task的上下文對(duì)象
  4.6.2 Task的創(chuàng)建
 4.7 Storm中的統(tǒng)計(jì)
  4.7.1 stats框架
  4.7.2 metric框架
 4.8 Ack框架
  4.8.1 Ack的原理
  4.8.2 Acker Bolt
 4.9 Storm總體架構(gòu)
第5章 Storm運(yùn)維和監(jiān)控
 5.1 主機(jī)信息監(jiān)控
 5.1 日志和監(jiān)控
 5.2 Storm UI和NimbusClient
 5.3 Storm Metric的使用
 5.4 Storm ZooKeeper的目錄
 5.5 Storm Hook的使用
第6章 Storm的擴(kuò)展
 6.1 Storm UI的擴(kuò)展
  6.1.1 Storm UI原生功能
  6.1.2 Storm UI新功能需求
  6.1.3 Storm的Thrift接口
 6.2 資源隔離
  6.2.1 CGroup測試
  6.2.2 基于CGroup的資源隔離的實(shí)現(xiàn)
第7章 Storm開發(fā)
 7.1 簡單示例
 7.2 調(diào)試和日志
 7.3 Storm Trident
 7.4 Strom DRPC
第8章 基于Storm的實(shí)時(shí)數(shù)據(jù)平臺(tái)
 8.1 Hadoop到Storm的代碼遷移經(jīng)驗(yàn)
 8.2 實(shí)時(shí)用戶畫像
  8.2.1 簡單實(shí)時(shí)畫像
  8.2.2 實(shí)時(shí)畫像優(yōu)化
  8.2.3 實(shí)時(shí)畫像的毫秒級(jí)更新
 8.3 其他場景畫像
 8.4 畫像的興趣度模型構(gòu)建
 8.5 外部畫像融合經(jīng)驗(yàn)分享
 8.6 交互式查詢和分析用戶畫像
 8.7 實(shí)時(shí)產(chǎn)品和店鋪信息更新
第9章 大數(shù)據(jù)應(yīng)用案例
 9.1 實(shí)時(shí)DAU計(jì)算
 9.2 實(shí)時(shí)個(gè)性化推薦
  9.2.1 推薦系統(tǒng)介紹
  9.2.2 實(shí)時(shí)推薦系統(tǒng)的方法
  9.2.3 基于Storm的實(shí)時(shí)推薦系統(tǒng)
 9.3 廣告投放的精準(zhǔn)化
  9.3.1 點(diǎn)擊率預(yù)測
  9.3.2 搜索引擎營銷
  9.3.3 精準(zhǔn)化營銷與千人千面
 9.4 實(shí)時(shí)意圖和搜索
  9.4.1 用戶意圖預(yù)測
  9.4.2 搜索比價(jià)
  9.4.3 搜索排序
第10章 Storm使用經(jīng)驗(yàn)和性能優(yōu)化
 10.1 使用經(jīng)驗(yàn)
  10.1.1 使用rebalance命令動(dòng)態(tài)調(diào)整并發(fā)度
  10.1.2 使用tick消息做定時(shí)器
  10.1.3 使用組件的并行度代替線程池
  10.1.4 不要用DRPC批量處理大數(shù)據(jù)
  10.1.5 不要在Spout中處理耗時(shí)的操作
  10.1.6 log4j的使用技巧
  10.1.7 注意fieldsGrouping的數(shù)據(jù)均衡性
  10.1.8 優(yōu)先使用localOrShuffleGrouping
  10.1.9 設(shè)置合理的MaxSpoutPending值
  10.1.10 設(shè)置合理的Worker數(shù)
  10.1.11 平衡吞吐量和時(shí)效性
 10.2 性能優(yōu)化
  10.2.1 找到Topology的性能瓶頸
  10.2.2 GC參數(shù)優(yōu)化
  10.3 性能優(yōu)化原則
 附錄A Kafka原理
 附錄B 將Storm源碼導(dǎo)入Eclipse

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)