注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書經濟管理管理電子商務品味大數據

品味大數據

品味大數據

定 價:¥59.00

作 者: 張玉宏 著
出版社: 北京大學出版社
叢編項:
標 簽: 計算機/網絡 數據倉庫與數據挖掘 數據庫

購買這本書可以去


ISBN: 9787301276099 出版時間: 2016-10-01 包裝: 平裝
開本: 16開 頁數: 420 字數:  

內容簡介

  當下,大數據是一個熱門的話題,很多領域的學者,從不同的角度進行了深入的討論?!镀肺洞髷祿窂拇髷祿臍v史、內涵、哲學和技術四個角度,全面解析大數據,讓讀者對大數據有更深入的了解。全書共11章,大致分為4塊:第1-3章主要漫談了大數據的有趣的歷史,包括數據的啟蒙、信息載體的演變和數據管理的發(fā)展脈絡。第4-6章主要聊聊大數據的內涵,包括大數據與哲學及第四科學范式的關聯(lián)。第7-9張是大數據的雜談,包括大數據的用途、可能面臨的陷阱以及通過小故事對大數據進行一些反思,第10-11章主要涉及大數據的技術,包括100余篇大數據論文的漫讀及Hadoop的初級實戰(zhàn)篇。圖書結構完整,行文幽默,并以圖文并茂、通俗易懂的方式力圖讓讀者心有余地品味大數據。圖書援引了數以百計大家牛人的觀點,或褒或貶,高手過招,精彩紛呈,是一本不容讀者錯過的大數據圖書。

作者簡介

  張玉宏 留美博士,曾跟隨導師Alok Choudhary教授參加了奧巴馬總統(tǒng)辦公室有關Big Data(大數據)研討會。

圖書目錄

目錄

序 在路上,學而時習之 / 張玉宏

第一章 大數據簡史漫談之一——數字的來源及數據思維的發(fā)展
1.1 人類的“數覺”與計數系統(tǒng) 
1.2 關于二進制的一點討論 
1.3 數字的誕生與廣泛應用的匹配法 
1.4 數學的“問世”與“算法”的祖師爺 
1.5 文字的“出爐”與羅馬語言的來歷 
1.6 古代的數據保存之道與文言文的“無奈”精簡 
1.7 古代的“數據中心”——圖書館 
1.8 古代計算工具的誕生及其演變 
1.9 統(tǒng)計學誕生——數據思維的漸起 
1.10 美國式的人口普查——大數據催生新技術 
1.11 中國式的人口統(tǒng)計與數目字管理 
1.12 本章小結與思考

第二章 大數據簡史漫談之二——近代存儲體系發(fā)展中的那些人和事
2.1 數據復制與傳播中的問題及解決方案
2.2 影響人類發(fā)展進程的幾次能源革命
2.3 不能遺忘的電氣時代的傳奇——特斯拉
2.4 霍爾瑞斯的穿孔卡 
2.5 現(xiàn)代通用計算機的奠基者——圖靈和馮·諾伊曼 
2.6 波弗勞姆的磁帶發(fā)明 
2.7 華人王安電腦的磁芯存儲器
2.8 IBM 的傳奇磁存儲世界
2.9 網絡存儲世界的興起
2.10 本章小結與思考

第三章 大數據簡史漫談之三——數據庫的發(fā)展與大數據的興起
3.1 近代“數據中心”之夢殤
3.2 “窮”則思變之網狀數據庫
3.3 濃墨重彩之關系數據庫
3.4 突破數據共享封鎖線的領頭人
3.5 高手對決的數據倉庫領域兩俠客
3.6 向非結構化進發(fā)的數據大趨勢
3.7 大數據術語的歷史淵源
3.8 現(xiàn)代大數據的誕生
3.9 在混沌和秩序轉化中螺旋上升
3.10 本章小結與思考

第四章 大數據的內涵
4.1 從數據、信息到知識、智慧的飛躍
4.2 大數據的多版本定義
4.3 大數據——新時代的生產資料
4.4 信息(數據)化、第二經濟與數據思維的轉變
4.5 大數據——來自學術界的青睞
4.6 大數據——來自政府層面的重視
4.7 大數據——來自工商業(yè)的熱捧
4.8 大數據內涵——“豈止于大”
4.8.1 大數據之“大”有不同(Volume)
4.8.2 大數據之唯“快”不破(Velocity)
4.8.3 大數據之五彩繽紛(Variety)  
4.8.4 大數據之價“值”無限(Value)
4.8.5 包括但不限于 4V
4.9 本章小結與思考

第五章 大數據時代的一點哲學思考
5.1 哲學與科學的關系——為什么計算機專業(yè)博士也發(fā)個哲學文憑(Ph.D)
5.2 大、小數據的“質”不同
5.3 大數據的數理哲學基礎——同構關系
5.4 大數據認識主體的變化——“替人消災”式的認識能免責嗎
5.5 波普爾的世界 3——秦始皇的長生夢,找錯了空間
5.6 大數據認識對象的變化——提升普羅大眾的權重 :“長尾理論”
5.7 認識論對大數據研究的指導意義 
5.7.1 科學始于觀察——證實主義 
5.7.2 證實主義的困頓——來自波普爾的批判
5.7.3 科學始于問題——波普爾的貢獻 
5.7.4 科學始于數據——大數據時代的科學轉機與思考
5.7.5 大數據的悲觀思潮
5.8 本章小結與思考

第六章 大數據研究的第四范式
6.1 谷歌公司的“不務正業(yè)”
6.2 塞吉·布林的“秘密”病情
6.3 布林病情的“治療”方案 
6.4 詹姆斯·格雷的科學第四范式 
6.5 科學研究的其他三個范式 
6.6 本章小結與思考

第七章 大數據,大有為
7.1 洞察帶來價值 
7.2 案例 1 :谷歌是如何“越俎代庖”地預測流感的 
7.2.1 流感治療網絡化 
7.2.2 “無意間”生產的搜索數據 
7.2.3 谷歌工程師們的杰作——流感預測趨勢(GFT)
7.2.4 谷歌的“越俎代庖”為何成功
7.2.5 案例小結 :數據、模型與理論
7.3 案例 2 :“全數據”是如何為葉詩文抱不平的
7.3.1 葉詩文事件的新聞背景
7.3.2 什么是性能分析法
7.3.3 質疑的合理性在哪里
7.3.4 “大數據 = 全數據”的威力——為葉詩文抱不平
7.3.5 案例小結
7.4 案例 3 :大數據是如何對抗癌癥的
7.4.1 癌癥大數據的特征是什么
7.4.2 癌癥從哪里來
7.4.3 大數據用之于癌癥斗爭,挑戰(zhàn)何在
7.4.4 癌癥診療的基礎大數據——獲取難
7.4.5 數據化帶來的顛覆式醫(yī)療——執(zhí)行難
7.4.6 哪些機構在用大數據對抗癌癥 
7.4.7 癌癥大數據的重要源頭——基因組數據 
7.4.8 大數據對抗癌癥,前景如何
7.4.9 案例小結
7.5 更多大數據應用案例
7.6 本章小結與思考

第八章 大數據之坑與小數據之美
8.1 引子——哪個 V 才是大數據最重要的特征
8.1.1 “大”有不同——Volume(大量)  
8.1.2 數據共征——Velocity(快速)與 Value(價值)
8.1.3 五彩繽“紛”——Variety(多樣)
8.2 大數據的力量與陷阱
8.2.1 大數據的力量 
8.2.2 大數據的陷阱 
8.2.3 今日王謝堂前燕,暫未飛入百姓家——大數據還沒那么普及 
8.2.4 你若安好,便是晴天——小數據之美
8.3 本章小結與思考

第九章 12 個小故事,思考大數據
9.1 故事 1 :大數據都是騙人的啊——大數據預測得準嗎
9.2 故事 2 :顛簸的街道——對不起,“n=all”只是一個幻覺 
9.3 故事 3 :醉漢路燈下找鑰匙——大數據的研究方法可笑嗎
9.4 故事 4 :園中有金不在金——大數據的價值 
9.5 故事 5 :蓋洛普抽樣的成功——大小之爭,“大”數據一定勝過小抽樣嗎
9.6 故事 6 :點球成金——數據流 PK 球探,誰更重要
9.7 故事 7 :啤酒和尿布——經典故事是偽造的,你知道嗎 
9.8 故事 8 :谷歌流感預測——預測是如何失效的
9.9 故事 9 :Target 超市預測女孩懷孕——“大數據”智慧,還是愚蠢
9.10 故事 10 :你的一夜情我知道——大數據的隱私之痛
9.11 故事 11 :大數據,無須懼——比薩店員更能知道顧客所有的信息嗎
9.12 故事 12 :撲朔離迷的“因果關系”——蘇格拉底的“詭辯術”
9.13 本章小結與思考

第十章 大數據技術漫談——需要讀懂的 100 篇大數據文獻
10.1 大數據價值的實現(xiàn) 
10.2 大數據分析的關鍵架構層 
10.3 架構的演進 
10.4 幾個重要的概念 
10.5 文件系統(tǒng)層
10.6 數據存儲層
10.7 資源管理器層(Resource Managers)
10.8 調度器(Schedulers)  
10.9 協(xié)調器(Coordination)
10.10 計算框架(Computational Frameworks)
10.11 數據分析層(Data Analysis)
10.12 數據集成層(Data Integration)
10.13 操作框架層(Operational Frameworks)
10.14 本章小結與思考

第十一章 牛刀小試之 Hadoop 實戰(zhàn)
11.1 什么是 Hadoop 
11.2 Hadoop 發(fā)展歷程
11.3 Hadoop 集群服務器的安裝與配置 
11.3.1 安裝 CentOS 7
11.3.2 配置 Java 環(huán)境
11.3.3 啟動和配置 SSH 服務
11.3.4 安裝 Hadoop
11.3.5 啟動 Hadoop
11.4 運行 Hello World 版 Hadoop 程序——WordCount 
11.5 全分布模式下的 Hadoop 集群構建 
11.5.1 Linux 以運行等級 3 啟動 
11.5.2 在 Windows 和 Mac OS 環(huán)境下克隆虛擬機 
11.5.3 設置靜態(tài) IP 地址 
11.5.4 修改 hosts 文件 
11.5.5 虛擬機的同步配置
11.5.6 SSH 的免密碼登錄
11.5.7 全分布模式下安裝 Hadoop 
11.5.8 同步配置文件
11.5.9 創(chuàng)建所需目錄
11.5.10 關閉防火墻
11.5.11 格式化文件系統(tǒng)
11.5.12 啟動 Hadoop 守護進程
11.5.13 驗證全分布模式
11.5.14 默認配置文件所在位置
11.5.15 關閉 Hadoop
11.5.16 Hadoop 的運行錯誤查找 
11.6 WordCount 代碼詳解
11.6.1 MapReduce 編程模型 
11.6.2 WordCount 的 MapReduce 處理流程
11.6.3 WordCount 源碼解讀
11.7 本章小結與思考
后  記

本目錄推薦

掃描二維碼
Copyright ? 讀書網 ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號