注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡軟件與程序設計Python機器學習與可視化分析實戰(zhàn)

Python機器學習與可視化分析實戰(zhàn)

Python機器學習與可視化分析實戰(zhàn)

定 價:¥69.00

作 者: 王曉華 著
出版社: 清華大學出版社
叢編項: 大數據技術叢書
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302616177 出版時間: 2022-09-01 包裝: 平裝
開本: 16開 頁數: 229 字數:  

內容簡介

  使用機器學習進行數據可視化分析是近年來研究的熱點內容之一。本書使用z新的Python作為機器學習的基本語言和工具,從搭建環(huán)境開始,逐步深入到理論、代碼、應用實踐中去,從而使初學者能夠獨立使用機器學習完成數據分析。本書配套示例代碼、PPT課件和答疑服務。 本書分為10章,內容包括:機器學習與Python開發(fā)環(huán)境、用于數據處理及可視化展示的Python類庫、NBA賽季數據可視化分析、聚類算法與可視化實戰(zhàn)、線性回歸與可視化實戰(zhàn)、邏輯回歸與可視化實戰(zhàn)、決策樹算法與可視化實戰(zhàn)、基于深度學習的酒店評論情感分類實戰(zhàn)、基于深度學習的手寫體圖像識別實戰(zhàn)、TensorFlow Datasets和TensorBoard訓練可視化。 本書內容詳盡、示例豐富,是機器學習初學者的入門書和必備的參考書,也可作為高等院校計算機及大數據相關專業(yè)的教材使用。

作者簡介

  王曉華,計算機專業(yè)講師,長期講授面向對象程序設計、數據結構、Hadoop程序設計等研究生和本科生相關課程;主要研究方向為云計算、數據挖掘。曾主持和參與多項國家和省級科研課題,獨立科研項目獲省級成果認定,發(fā)表過多篇論文,擁有一項國家專利。著有《Spark MLlib機器學習實踐》《TensorFlow深度學習應用實踐》《OpenCV+TensorFlow深度學習與計算機視覺實戰(zhàn)》《TensorFlow 2.0卷積神經網絡實戰(zhàn)》《TensorFlow+Keras自然語言處理實戰(zhàn)》等圖書。

圖書目錄

第1章 機器學習與Python開發(fā)環(huán)境 1
1.1 機器學習概述 1
1.1.1 機器學習的前世今生 1
1.1.2 機器學習的研究現狀與方向 3
1.1.3 機器學習之美——數據的可視化 4
1.2 Python的基本安裝和用法 5
1.2.1 Anaconda的下載與安裝 6
1.2.2 Python編譯器PyCharm的安裝 8
1.2.3 使用Python實現softmax函數計算 11
1.3 Python常用類庫中的threading 12
1.3.1 threading模塊中的Thread類 13
1.3.2 threading中Lock類 14
1.3.3 threading中Join類 15
1.4 本章小結 16
第2章 用于數據處理及可視化展示的 Python類庫 17
2.1 從小例子起步——NumPy的初步使用 17
2.1.1 數據的矩陣化 17
2.1.2 數據分析 19
2.1.3 基于統(tǒng)計分析的數據處理 20
2.2 圖形化數據處理——Matplotlib包的使用 21
2.2.1 差異的可視化 21
2.2.2 坐標圖的展示 22
2.2.3 大數據的可視化展示 23
2.3 常用的統(tǒng)計分析方法——相似度計算 26
2.3.1 歐幾里得相似度計算 26
2.3.2 余弦相似度計算 27
2.3.3 歐幾里得相似度與余弦相似度的比較 28
2.4 數據的統(tǒng)計學可視化展示 28
2.4.1 數據的四分位數 28
2.4.2 數據的四分位數示例 29
2.4.3 數據的標準化 32
2.4.4 數據的平行化處理 34
2.4.5 熱力圖——屬性相關性檢測 35
2.5 Python分析某地降雨量變化規(guī)律 36
2.5.1 不同年份的相同月份統(tǒng)計 36
2.5.2 不同月份之間的增減程度比較 38
2.5.3 每月降雨是否相關 39
2.6 本章小結 40
第3章 NBA賽季數據可視化分析 41
3.1 基于球員薪資的數據分析 41
3.1.1 關于球員薪資的一些基本分析 41
3.1.2 關于球員RPM相關性的分析 44
3.1.3 關于球員RPM數據的分析 45
3.2 Seaborn常用的數據可視化方法 46
3.2.1 關于RPM、薪資和年齡的一元可視化分析 46
3.2.2 關于RPM、薪資、年齡的二元可視化分析 47
3.2.3 關于衍生變量的可視化分析 49
3.2.4 NBA球隊數據的分析結果 51
3.3 NBA賽季數據分析 53
3.3.1 關于賽季發(fā)展的一些基本分析 53
3.3.2 群星璀璨的NBA 57
3.3.3 關于球員高級數據的一些基本分析 65
3.4 本章小結 66
第4章 聚類算法與可視化實戰(zhàn) 67
4.1 聚類的定義 67
4.1.1 衡量距離的方法 68
4.1.2 聚類算法介紹 72
4.2 經典K-means聚類算法實戰(zhàn) 76
4.2.1 經典K-means算法的Python實現 76
4.2.2 基于Iris數據集的可視化分析 78
4.2.3 投某音還是投某寶?基于K-means的廣告效果聚類分析 81
4.3 基于密度的聚類算法DBSCAN 88
4.3.1 DBSCAN算法原理與Python實現 89
4.3.2 基于sklearn的DBSCAN實戰(zhàn) 93
4.3.3 DBSCAN的優(yōu)缺點比較 95
4.4 基于層次的聚類算法 96
4.4.1 基于層次算法的原理 96
4.4.2 Agglomerative算法與示例 98
4.5 本章小結 101
第5章 線性回歸與可視化實戰(zhàn) 102
5.1 線性回歸的基本內容與Python實現 102
5.1.1 什么是線性回歸 102
5.1.2 最小二乘法詳解 103
5.1.3 道士下山的故事——隨機梯度下降算法 105
5.1.4 基于一元線性回歸的比薩餅價格計算 107
5.1.5 線性回歸的評價指標 109
5.1.6 線性回歸應用 110
5.2 多元線性回歸實戰(zhàn) 111
5.2.1 多元線性回歸的基本內容 112
5.2.2 多元線性回歸的Python實現 113
5.2.3 基于多元線性回歸的房價預測實戰(zhàn) 115
5.3 本章小結 122
第6章 邏輯回歸與可視化實戰(zhàn) 123
6.1 邏輯回歸的基本內容與Python實現 123
6.1.1 邏輯回歸是一個分類任務 124
6.1.2 邏輯回歸的基本內容 124
6.1.3 鏈式求導法則 126
6.1.4 邏輯回歸中的Sigmoid函數 131
6.2 基于邏輯回歸的鳶尾花(Iris)分類 132
6.2.1 鳶尾花數據集簡介與基礎可視化分析 132
6.2.2 鳶尾花數據集進階可視化分析 135
6.2.3 基于鳶尾花數據集的數據挖掘 137
6.2.4 基于線性回歸與K-means的鳶尾花數據集分類 140
6.2.5 基于邏輯回歸的鳶尾花數據集分類 143
6.3 本章小結 147
第7章 決策樹算法與可視化實戰(zhàn) 148
7.1 水晶球的秘密 148
7.1.1 決策樹 149
7.1.2 決策樹的算法基礎——信息熵 149
7.1.3 決策樹的算法基礎——ID3算法 151
7.2 決策樹背后的信息——信息熵與交叉熵 152
7.2.1 交叉熵基本原理詳解 152
7.2.2 交叉熵的表述 154
7.3 決策樹實戰(zhàn)——分類與回歸樹 156
7.3.1 分類樹與回歸樹的區(qū)別 156
7.3.2 基于分類樹的鳶尾花分類實戰(zhàn) 157
7.3.2 基于回歸樹的波士頓房價預測 158
7.4 基于隨機森林的信用卡違約實戰(zhàn) 159
7.4.1 隨機森林的基本內容 159
7.4.2 隨機森林與決策樹的可視化比較 161
7.4.3 基于隨機森林的信用卡違約檢測 164
7.5 本章小結 175
第8章 基于深度學習的酒店評論情感分類實戰(zhàn) 176
8.1 深度學習 176
8.1.1 何為深度學習 176
8.1.2 與傳統(tǒng)的“淺層學習”的區(qū)別 178
8.2 酒店評論情感分類——深度學習入門 178
8.3 深度學習的流程、應用場景和模型分類 182
8.3.1 深度學習的流程與應用場景 182
8.3.2 深度學習的模型分類 183
8.3 本章小結 184
第9章 基于深度學習的手寫體圖像識別實戰(zhàn) 185
9.1 卷積運算的基本概念 185
9.1.1 卷積運算 186
9.1.2 TensorFlow中卷積函數的實現 187
9.1.3 池化運算 189
9.1.4 softmax激活函數 190
9.1.5 卷積神經網絡原理 191
9.2 MNIST手寫體識別 193
9.2.1 MNIST數據集 193
9.2.2 MNIST數據集特征和標簽 195
9.2.3 卷積神經網絡編程實戰(zhàn):MNIST數據集 197
9.3 基于多層感知機的手寫體識別 200
9.3.1 多層感知機的原理與實現 201
9.3.2 多層感知機的激活函數 203
9.4 消除過擬合——正則化與dropout 205
9.4.1 正則化與dropout概述 205
9.4.2 使用防過擬合處理的多層感知機 206
9.4.3 Keras創(chuàng)建多層感知機的細節(jié)問題 207
9.5 本章小結 208
第10章 TensorFlow Datasets和TensorBoard 訓練可視化 210
10.1 TensorFlow Datasets簡介 210
10.1.1 TensorFlow Datasets的安裝 212
10.1.2 TensorFlow Datasets的使用 212
10.2 TensorFlow Datasets數據集的使用——FashionMNIST 214
10.2.1 FashionMNIST數據集的下載與展示 215
10.2.2 模型的建立與訓練 216
10.3 使用Keras對FashionMNIST數據集進行處理 218
10.3.1 獲取數據集 218
10.3.2 數據集的調整 218
10.3.3 使用Python類函數建立模型 219
10.3.4 Model的查看和參數打印 220
10.3.5 模型的訓練和評估 221
10.4 使用TensorBoard可視化訓練過程 223
10.4.1 TensorBoard的文件夾的設置 223
10.4.2 TensorBoard的顯式調用 224
10.4.3 TensorBoard的使用 225
10.5 本章小結 229

本目錄推薦

掃描二維碼
Copyright ? 讀書網 ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號