注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)工業(yè)技術(shù)建筑科學建筑設(shè)計Python數(shù)據(jù)科學導(dǎo)論:概念、技術(shù)與應(yīng)用

Python數(shù)據(jù)科學導(dǎo)論:概念、技術(shù)與應(yīng)用

Python數(shù)據(jù)科學導(dǎo)論:概念、技術(shù)與應(yīng)用

定 價:¥59.00

作 者: (西)勞拉·伊瓜爾,桑蒂·塞吉
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787111604648 出版時間: 2018-09-01 包裝:
開本: 頁數(shù): 字數(shù):  

內(nèi)容簡介

  《Python數(shù)據(jù)科學導(dǎo)論》通過理論與實踐相結(jié)合的方式來闡述數(shù)據(jù)科學的一系列重要概念及算法,以使讀者學會如何管理并利用數(shù)據(jù)。本書共有11章,第1章概要地介紹了數(shù)據(jù)科學的現(xiàn)狀并給出了一些使用本書的建議;第2章介紹了Python語言數(shù)據(jù)科學生態(tài)系統(tǒng),涉及NumPy、SciPy和Pandas等熱門第三方庫;第3~7章著重講解了統(tǒng)計學和機器學習的知識,涉及描述統(tǒng)計學、統(tǒng)計推斷、監(jiān)督學習、回歸分析、無監(jiān)督學習等主題;第8~10章詳細介紹了數(shù)據(jù)科學的一些主要應(yīng)用,如網(wǎng)絡(luò)分析、推薦系統(tǒng)和情感分析;第11章介紹了并行計算及性能優(yōu)化方法。

作者簡介

  Laura Igual博士是巴塞羅那大學數(shù)學和計算機科學系的副教授。她于2000 年獲得西班牙瓦倫西亞大學的數(shù)學學位,并于2006 年獲得西班牙龐培法布拉大學的博士學位。她的研究領(lǐng)域包括計算機視覺、醫(yī)學成像、機器學習和數(shù)據(jù)科學。Santi Seguí博士是巴塞羅那大學數(shù)學和計算機科學系的助理教授。自2007 年起,他擔任了西班牙巴塞羅那自治大學的計算機科學工程師。他于2011 年獲得西班牙巴塞羅那大學的博士學位。他的研究領(lǐng)域包括計算機視覺、應(yīng)用機器學習和數(shù)據(jù)科學。

圖書目錄

譯者序

原書前言

作者和貢獻者簡介

第1章 數(shù)據(jù)科學概述 // 1 

1.1 什么是數(shù)據(jù)科學 //1 

1.2 關(guān)于本書 //2

第2章 數(shù)據(jù)專家的工具箱 //4 

2.1 引言 // 4 

2.2 為什么選擇Python // 4 

2.3 數(shù)據(jù)專家的基本Python庫 // 5 

2.3.1 數(shù)值和科學計算:NumPy和SciPy // 5 

2.3.2 Scikit-learn:Python中的機器學習庫 // 5 

2.3.3 Pandas:Python數(shù)據(jù)分析庫 // 5 

2.4 數(shù)據(jù)科學生態(tài)系統(tǒng)的安裝 // 6 

2.5 集成開發(fā)環(huán)境 // 6 

2.5.1 網(wǎng)絡(luò)集成開發(fā)環(huán)境:Jupyter // 7 

2.6 數(shù)據(jù)專家從Python開始 // 7 

2.6.1 讀取 // 11 

2.6.2 選擇數(shù)據(jù) // 13 

2.6.3 篩選數(shù)據(jù) // 14 

2.6.4 篩選缺失的數(shù)據(jù) // 15 

2.6.5 處理數(shù)據(jù) // 15 

2.6.6 排序 // 19 

2.6.7 分組數(shù)據(jù) // 20 

2.6.8 重排數(shù)據(jù) // 21 

2.6.9 對數(shù)據(jù)進行排名 // 22 

2.6.10 繪圖 // 23 

2.7 小結(jié) // 24

第3章 描述統(tǒng)計學 // 25 

3.1 引言 // 25 

3.2 數(shù)據(jù)準備 // 25 

3.2.1 Adult數(shù)據(jù)集示例 // 26 

3.3 探索性數(shù)據(jù)分析 // 28 

3.3.1 匯總數(shù)據(jù) // 28 

3.3.2 數(shù)據(jù)分布 // 31 

3.3.3 離群點的處理 // 33 

3.3.4 測量不對稱性:偏度和皮爾遜中值偏度系數(shù) // 36 

3.3.5 連續(xù)分布 // 38 

3.3.6 核密度 // 39 

3.4 估計 // 41 

3.4.1 樣本和估計均值、方差和標準記分 // 41 

3.4.2 協(xié)方差、皮爾遜相關(guān)和斯皮爾曼秩相關(guān) // 42 

3.5 小結(jié) // 44

參考文獻 // 45 

第4章 統(tǒng)計推斷 // 46 

4.1 引言 // 46 

4.2 統(tǒng)計推斷:頻率論方法 // 46 

4.3 測量估計的差異性 // 47 

4.3.1 點估計 // 47 

4.3.2 置信區(qū)間 // 50 

4.4 假設(shè)檢驗 // 53 

4.4.1 用置信區(qū)間檢驗假設(shè) // 53 

4.4.2 使用p值檢驗假設(shè) // 55 

4.5 效應(yīng)E是真實的嗎 // 57 

4.6 小結(jié) // 57

參考文獻 // 58

第5章 監(jiān)督學習 // 59 

5.1 引言 // 59 

5.2 問題 // 60 

5.3 第一步 // 60 

5.4 什么是學習? // 69 

5.5 學習曲線 // 70 

5.6 訓練、驗證和測試 // 73 

5.7 兩種學習模型 // 76 

5.7.1 學習三要素 // 76 

5.7.2 支持向量機 // 77 

5.7.3 隨機森林 // 79 

5.8 結(jié)束學習過程 // 80 

5.9 商業(yè)案例 // 81 

5.10 小結(jié) // 83

參考文獻 // 83

第6章 回歸分析 // 84 

6.1 引言 // 84 

6.2 線性回歸 // 84 

6.2.1 簡單線性回歸 // 85 

6.2.2 多元線性回歸和多項式回歸 // 90 

6.2.3 稀疏模型 // 90 

6.3 邏輯斯蒂回歸 // 97 

6.4 小結(jié) // 99

參考文獻 // 99

第7章 無監(jiān)督學習 // 100 

7.1 引言 // 100 

7.2 聚類 // 100 

7.2.1 相似度和距離 // 101 

7.2.2 什么是一個好的聚類?定義衡量聚類質(zhì)量的度量 // 101 

7.2.3 聚類技術(shù)的分類標準 // 104 

7.3 案例學習 // 113 

7.4 小結(jié) // 118

參考文獻 // 119

第8章 網(wǎng)絡(luò)分析 // 120 

8.1 引言 // 120 

8.2 圖的基本定義 // 121 

8.3 社交網(wǎng)絡(luò)分析 // 122 

8.3.1 NetworkX基礎(chǔ) // 122 

8.3.2 實際案例:Facebook數(shù)據(jù)集 // 123 

8.4 中心性 // 125 

8.4.1 在圖中繪制中心性 // 130 

8.4.2 PageRank // 132 

8.5 自我網(wǎng)絡(luò) // 134 

8.6 社區(qū)發(fā)現(xiàn) // 138 

8.7 小結(jié) // 139

參考文獻 // 139 

第9章 推薦系統(tǒng) // 140 

9.1 引言 // 140 

9.2 推薦系統(tǒng)如何工作? // 140 

9.2.1 基于內(nèi)容的過濾 // 141 

9.2.2 協(xié)作過濾 // 141 

9.2.3 混合推薦系統(tǒng) // 141 

9.3 建模用戶偏好 // 142 

9.4 評估推薦系統(tǒng) // 142 

9.5 實際案例 // 143 

9.5.1 MovieLens數(shù)據(jù)集 // 143 

9.5.2 基于用戶的協(xié)作過濾 // 145 

9.6 小結(jié) // 153

參考文獻 // 153

第10章 用于情感分析的統(tǒng)計自然語言處理 // 154 

10.1 引言 // 154 

10.2 數(shù)據(jù)清洗 // 155 

10.3 文本表示 // 158 

10.3.1 二元組和n元組 // 163 

10.4 實際案例 // 163 

10.5 小結(jié) // 168

參考文獻 // 168

第11章 并行計算 // 169 

11.1 引言 // 169 

11.2 架構(gòu) // 170 

11.2.1 入門指南 // 171 

11.2.2 連接到集群(引擎)// 171 

11.3 多核編程 // 172 

11.3.1 引擎的直接視圖 // 172 

11.3.2 引擎的負載均衡視圖 // 175 

11.4 分布式計算 // 176 

11.5 實際應(yīng)用:紐約出租車旅行 // 177 

11.5.1 直接視圖非阻塞方案 // 178 

11.5.2 實驗結(jié)果 // 180 

11.6 小結(jié) // 182

參考文獻 // 182


本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號