注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)計(jì)算機(jī)科學(xué)理論與基礎(chǔ)知識(shí)數(shù)據(jù)科學(xué)實(shí)戰(zhàn)

數(shù)據(jù)科學(xué)實(shí)戰(zhàn)

數(shù)據(jù)科學(xué)實(shí)戰(zhàn)

定 價(jià):¥79.00

作 者: (美)舒特(Rachel Schutt),(美)奧尼爾(Cathy O''Neil)
出版社: 人民郵電出版社
叢編項(xiàng):
標(biāo) 簽: 計(jì)算機(jī)/網(wǎng)絡(luò) 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 數(shù)據(jù)庫

ISBN: 9787115383495 出版時(shí)間: 2015-03-01 包裝: 平裝
開本: 16開 頁數(shù): 290頁 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書脫胎于哥倫比亞大學(xué)“數(shù)據(jù)科學(xué)導(dǎo)論”課程的教學(xué)講義,它界定了數(shù)據(jù)科學(xué)的研究范疇,是一本注重人文精神,多角度、全方位、深入介紹數(shù)據(jù)科學(xué)的實(shí)用指南,堪稱大數(shù)據(jù)時(shí)代的實(shí)戰(zhàn)寶典。本書旨在讓讀者能夠舉一反三地解決重要問題,內(nèi)容包括:數(shù)據(jù)科學(xué)及工作流程、統(tǒng)計(jì)模型與機(jī)器學(xué)習(xí)算法、信息提取與統(tǒng)計(jì)變量創(chuàng)建、數(shù)據(jù)可視化與社交網(wǎng)絡(luò)、預(yù)測(cè)模型與因果分析、數(shù)據(jù)預(yù)處理與工程方法。另外,本書還將帶領(lǐng)讀者展望數(shù)據(jù)科學(xué)未來的發(fā)展。

作者簡(jiǎn)介

  Rachel Schutt,美國(guó)新聞集團(tuán)旗下數(shù)據(jù)科學(xué)部門高級(jí)副總裁、哥倫比亞大學(xué)統(tǒng)計(jì)系兼職教授、約翰遜實(shí)驗(yàn)室高級(jí)研究科學(xué)家,同時(shí)也是哥倫比亞大學(xué)數(shù)據(jù)科學(xué)及工程研究所教育委員會(huì)的發(fā)起人之一。她曾在谷歌研究院工作數(shù)年,負(fù)責(zé)設(shè)計(jì)算法原型并通過建模理解用戶行為。Cathy O'Neil,約翰遜實(shí)驗(yàn)室高級(jí)數(shù)據(jù)科學(xué)家、哈佛大學(xué)數(shù)學(xué)博士、麻省理工學(xué)院數(shù)學(xué)系博士后、巴納德學(xué)院教授,曾發(fā)表過大量算術(shù)代數(shù)幾何方面的論文。他曾在著名的全球投資管理公司D.E. Shaw擔(dān)任對(duì)沖基金金融師,后加入專門評(píng)估銀行和對(duì)沖基金風(fēng)險(xiǎn)的軟件公司RiskMetrics,個(gè)人博客:mathbabe.org。

圖書目錄

作者介紹
關(guān)于封面圖
前言
第1章簡(jiǎn)介:什么是數(shù)據(jù)科學(xué)
 1.1大數(shù)據(jù)和數(shù)據(jù)科學(xué)的喧囂
 1.2沖出迷霧
 1.3為什么是現(xiàn)在
 1.4數(shù)據(jù)科學(xué)的現(xiàn)狀和歷史
 1.5數(shù)據(jù)科學(xué)的知識(shí)結(jié)構(gòu)
 1.6思維實(shí)驗(yàn):元定義
 1.7什么是數(shù)據(jù)科學(xué)家
  1.7.1學(xué)術(shù)界對(duì)數(shù)據(jù)科學(xué)家的定義
  1.7.2工業(yè)界對(duì)數(shù)據(jù)科學(xué)家的定義
第2章統(tǒng)計(jì)推斷、探索性數(shù)據(jù)分析和數(shù)據(jù)科學(xué)工作流程
 2.1大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)學(xué)思考
  2.1.1統(tǒng)計(jì)推斷
  2.1.2總體和樣本
  2.1.3大數(shù)據(jù)的總體和樣本
  2.1.4大數(shù)據(jù)意味著大膽的假設(shè)
  2.1.5建模
 2.2探索性數(shù)據(jù)分析
  2.2.1探索性數(shù)據(jù)分析的哲學(xué)
  2.2.2練習(xí):探索性數(shù)據(jù)分析
 2.3數(shù)據(jù)科學(xué)的工作流程
 2.4思維實(shí)驗(yàn):如何模擬混沌
 2.5案例學(xué)習(xí):RealDirect
  2.5.1RealDirect是如何賺錢的
  2.5.2練一練:RealDirect公司的數(shù)據(jù)策略
第3章算法
 3.1機(jī)器學(xué)習(xí)算法
 3.2三大基本算法
  3.2.1線性回歸模型
  3.2.2足近鄰模型(k-NN)
  3.2.3I(均值算法
 3.3練習(xí):機(jī)器學(xué)習(xí)算法基礎(chǔ)
 3.4總結(jié)
 3.5思維實(shí)驗(yàn):關(guān)于統(tǒng)計(jì)學(xué)家的自動(dòng)化
第4章垃圾郵件過濾器、樸素貝葉斯與數(shù)據(jù)清理
 4.1思維實(shí)驗(yàn):從實(shí)例中學(xué)習(xí)
  4.1.1線性回歸為何不適用
  4.1.2l(近鄰效果如何
 4.2樸素貝葉斯模型
  4.2.1貝葉斯法則
  4.2.2個(gè)別單詞的過濾器
  4.2.3直通樸素貝葉斯
 4.3拉普拉斯平滑法
 4.4對(duì)比樸素貝葉斯和k近鄰
 4.5Bash代碼示例”
 4.6網(wǎng)頁抓?。篈Pl和其他工具
 4.7Jake的練習(xí)題:文章分類問題中的樸素貝葉斯模型
第5章邏輯回歸
 5.1思維實(shí)驗(yàn)
 5.2分類器
  5.2.1運(yùn)行時(shí)間
  5.2.2你自己
  5.2.3模型的可解釋性
  5.2.4可擴(kuò)展性
 ……
第6章時(shí)間戳數(shù)據(jù)與金融建模
第7章從數(shù)據(jù)到結(jié)論
第8章構(gòu)建面向大量用戶的推薦引擎
第9章數(shù)據(jù)可視化與欺詐偵測(cè)
第10章社交網(wǎng)絡(luò)與數(shù)據(jù)新聞學(xué)
第11章因果關(guān)系研究
第12章流行病學(xué)
第13章從競(jìng)賽中學(xué)到的:數(shù)據(jù)泄漏和模型評(píng)價(jià)
第14章數(shù)據(jù)工程:Mapreduce pregel、Hadoop
第15章聽聽學(xué)生學(xué)們?cè)趺凑f
第16章下一代數(shù)據(jù)科學(xué)家、自大狂和職業(yè)道德

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)