“大數(shù)據(jù)”近年來成為IT領域的熱點話題,人們每天都會通過互聯(lián)網、移動設備等產生大量數(shù)據(jù)。如何管理大數(shù)據(jù)、掌握大數(shù)據(jù)的核心技術、理解大數(shù)據(jù)相關的生態(tài)系統(tǒng)等,是作為大數(shù)據(jù)開發(fā)者必須學習和熟練掌握的知識。本系列書以“大數(shù)據(jù)開發(fā)者”應掌握的技術為主線,共分兩卷,以7個模塊分別介紹如何管理大數(shù)據(jù)生態(tài)系統(tǒng)、如何存儲和處理數(shù)據(jù)、如何利用Hadoop工具、如何利用NoSQL與Hadoop協(xié)同工作,以及如何利用Hadoop商業(yè)發(fā)行版和管理工具。本系列書涵蓋了大數(shù)據(jù)開發(fā)工作的核心內容,全面且詳盡地涵蓋了大數(shù)據(jù)開發(fā)的各個領域。本書為第2卷,共3個模塊,分別介紹Hadoop工具(如ZooKeeper、Sqoop、Flume、YARN和Storm等),利用NoSQL和Hadoop完成實時、安全和云的相關工作,以及Hadoop商業(yè)發(fā)行版和管理工具(如Cloudera、Hortonworks、Greenplum Pivotal HD等),最后介紹幾個實用軟件的功能、指南和安裝步驟。本書適用于想成為大數(shù)據(jù)開發(fā)人員以及所有對大數(shù)據(jù)開發(fā)感興趣的技術人員和決策者閱讀。