注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計Python大規(guī)模機器學(xué)習(xí)

Python大規(guī)模機器學(xué)習(xí)

Python大規(guī)模機器學(xué)習(xí)

定 價:¥89.00

作 者: [荷] 巴斯蒂安·賈丁(Bastiaan Sjardin) 著,王貴財 劉春明 譯
出版社: 機械工業(yè)出版社
叢編項: 智能系統(tǒng)與技術(shù)叢書
標(biāo) 簽: 暫缺

ISBN: 9787111623144 出版時間: 2019-05-01 包裝: 平裝
開本: 16開 頁數(shù): 299 字?jǐn)?shù):  

內(nèi)容簡介

  本書不僅介紹大規(guī)模機器學(xué)習(xí)的基本概念,還包含豐富的案例研究。書中所選皆為*實用的技術(shù)和工具,而對理論細(xì)節(jié)不進行深入討論,旨在提供大規(guī)模機器學(xué)習(xí)方法(甚至非常規(guī)方法)。不管是初學(xué)者、普通用戶還是專家級用戶,通過本書都能理解并掌握利用Python進行大規(guī)模機器學(xué)習(xí)。為讓讀者快速掌握核心技術(shù),本書由淺入深講解大量實例,圖文并茂呈現(xiàn)每一步的操作結(jié)果,幫助讀者更好地掌握大規(guī)模機器學(xué)習(xí)Python工具。例如:基于Scikit-learn可擴展學(xué)習(xí)、 Liblinear和Vowpal Wabbit快速支持向量機、基于Theano與H2O的大規(guī)模深度學(xué)習(xí)方法、TensorFlow深度學(xué)習(xí)技術(shù)與在線神經(jīng)網(wǎng)絡(luò)方法、大規(guī)模分類和回歸樹的可擴展解決方案、大規(guī)模無監(jiān)督學(xué)習(xí)(PCA,聚類分析和主題建模等)擴展方法、Hadoop和Spark分布式環(huán)境、Spark機器學(xué)習(xí)實踐以及Theano和GPU計算的基礎(chǔ)知識。

作者簡介

  Bastiaan Sjardin是一位具有人工智能和數(shù)學(xué)背景的數(shù)據(jù)科學(xué)家和公司創(chuàng)始人。他獲得萊頓大學(xué)和麻省理工學(xué)院(MIT)校園課程聯(lián)合培養(yǎng)的認(rèn)知科學(xué)碩士學(xué)位。在過去五年中,他從事過廣泛的數(shù)據(jù)科學(xué)和人工智能項目。他是密歇根大學(xué)社會網(wǎng)絡(luò)分析課程Coursera和約翰斯·霍普金斯大學(xué)機器學(xué)習(xí)實踐課程的常客。他擅長Python和R編程語言。目前,他是Quandbee(http://wwwquandbeecom)的聯(lián)合創(chuàng)始人,該公司主要提供大規(guī)模機器學(xué)習(xí)和人工智能應(yīng)用。 Luca Massaron是一位數(shù)據(jù)科學(xué)家和市場研究總監(jiān),擅長多元統(tǒng)計分析、機器學(xué)習(xí)和客戶洞察力研究,在解決實際問題和應(yīng)用推理、統(tǒng)計、數(shù)據(jù)挖掘和算法來為用戶創(chuàng)造價值方面有十多年經(jīng)驗。從成為意大利網(wǎng)絡(luò)觀眾分析的先驅(qū),到躋身前十名的Kaggler,他一直對數(shù)據(jù)分析充滿熱情,還向?qū)I(yè)人士和普通大眾展示數(shù)據(jù)驅(qū)動知識發(fā)現(xiàn)的潛力,相比不必要的復(fù)雜性,他更喜歡簡潔。他相信僅僅通過基本操作就可以在數(shù)據(jù)科學(xué)中收獲很多東西。 Alberto Boschetti是一位具有信號處理和統(tǒng)計專業(yè)知識的數(shù)據(jù)科學(xué)家。他獲得電信工程博士學(xué)位,目前在倫敦生活和工作。在其工作項目中,他面臨過從自然語言處理(NLP)和機器學(xué)習(xí)到分布式處理的挑戰(zhàn)。 他在工作中充滿熱情,始終努力了解數(shù)據(jù)科學(xué)的*新發(fā)展,他喜歡參加聚會、會議和其他活動。

圖書目錄

譯者序
前言
作者簡介
審校者簡介
第1章邁向可擴展性的第一步1
11詳細(xì)解釋可擴展性1
111大規(guī)模實例3
112介紹Python4
113使用Python進行向上擴展4
114使用Python進行向外擴展5
12Python用于大規(guī)模機器學(xué)習(xí)6
121選擇Python 2還是Python 36
122安裝Python7
123逐步安裝7
124安裝軟件包8
125軟件包升級9
126科學(xué)計算發(fā)行版10
127Jupyter/IPython介紹11
13Python包13
131NumPy14
132SciPy14
133pandas14
134Scikitlearn15
135小結(jié)21
第2章Scikitlearn中的可擴展學(xué)習(xí)22
21非核心學(xué)習(xí)22
211選擇子采樣23
212一次優(yōu)化一個實例24
213構(gòu)建非核心學(xué)習(xí)系統(tǒng)25
22流化源數(shù)據(jù)25
221處理真實數(shù)據(jù)集26
222第一個示例——流化共享單車數(shù)據(jù)集28
223使用pandas I/O工具30
224使用數(shù)據(jù)庫31
225關(guān)注實例排序35
23隨機學(xué)習(xí)37
231批處理梯度下降37
232隨機梯度下降40
233Scikitlearn的SGD實現(xiàn)40
234定義SGD學(xué)習(xí)參數(shù)42
24數(shù)據(jù)流的特征管理43
241描述目標(biāo)46
242哈希技巧49
243其他基本變換51
244流測試和驗證52
245使用SGD52
25小結(jié)56
第3章實現(xiàn)快速SVM57
31測試數(shù)據(jù)集58
311共享單車數(shù)據(jù)集58
312森林覆蓋類型數(shù)據(jù)集58
32支持向量機59
321hinge loss及其變形64
322Scikitlearn的SVM實現(xiàn)65
323探究通過子采樣改善非線性SVM68
324使用SGD實現(xiàn)大規(guī)模SVM70
33正則化特征選擇77
34SGD中的非線性78
35超參數(shù)調(diào)整82
36小結(jié)96
第4章神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)97
41神經(jīng)網(wǎng)絡(luò)架構(gòu)98
411神經(jīng)網(wǎng)絡(luò)如何學(xué)習(xí)106
412選擇正確的架構(gòu)110
413使用神經(jīng)網(wǎng)絡(luò)111
414sknn并行化111
42神經(jīng)網(wǎng)絡(luò)和正則化113
43神經(jīng)網(wǎng)絡(luò)和超參數(shù)優(yōu)化115
44神經(jīng)網(wǎng)絡(luò)和決策邊界117
45用H2O進行規(guī)?;疃葘W(xué)習(xí)120
451用H2O進行大規(guī)模深度學(xué)習(xí)121
452H2O上的網(wǎng)格搜索124
46深度學(xué)習(xí)和無監(jiān)督預(yù)訓(xùn)練126
47使用theanets進行深度學(xué)習(xí)126
48自動編碼器和無監(jiān)督學(xué)習(xí)128
49小結(jié)131
第5章用TensorFlow進行深度學(xué)習(xí)132
51TensorFlow安裝134
52在TensorFlow上使用SkFlow進行機器學(xué)習(xí)140
53安裝Keras和TensorFlow148
54在TensorFlow中通過Keras實現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)152
541卷積層153
542池化層153
543全連接層154
55增量CNN方法156
56GPU計算156
57小結(jié)159
第6章大規(guī)模分類和回歸樹160
61bootstrap聚合162
62隨機森林和極端隨機森林163
63隨機搜索實現(xiàn)快速參數(shù)優(yōu)化167
64CART和boosting172
65XGBoost179
651XGBoost回歸181
652XGBoost流化大型數(shù)據(jù)集184
653XGBoost模型存儲185
66用H2O實現(xiàn)非核心CART185
661H2O上的隨機森林和網(wǎng)格搜索186
662H2O上的隨機梯度增強和網(wǎng)格搜索188
67小結(jié)191
第7章大規(guī)模無監(jiān)督學(xué)習(xí)192
71無監(jiān)督方法192
72特征分解:PCA193
721隨機化PCA199
722增量PCA200
723稀疏PCA201
73使用H2O的PCA202
74K-均值聚類算法203
741初始化方法206
742K-均值假設(shè)206
743選擇最佳K209
744擴展K-均值算法:小批量212
75用H2O實現(xiàn)K-均值216
76LDA218
77小結(jié)226
第8章分布式環(huán)境——Hadoop和Spark227
81從單機到集群227
82設(shè)置VM230
821VirtualBox230
822Vagrant232
823使用VM232
83Hadoop生態(tài)系統(tǒng)234
831架構(gòu)234
832HDFS235
833MapReduce242
834YARN250
84Spark250
85小結(jié)260
第9章Spark機器學(xué)習(xí)實踐261
91為本章設(shè)置虛擬機261
92跨集群節(jié)點共享變量262
921廣播只讀變量262
922累加器只寫變量264
923廣播和累加器的示例265
93Spark的數(shù)據(jù)預(yù)處理267
931JSON文件和Spark DataFrame268
932處理缺失數(shù)據(jù)270
933在內(nèi)存中分組和創(chuàng)建表271
934將預(yù)處理的DataFrame或RDD寫入磁盤273
935使用Spark DataFrame274
94Spark機器學(xué)習(xí)276
941Spark處理KDD99數(shù)據(jù)集277
942讀取數(shù)據(jù)集277
943特征工程280
944訓(xùn)練學(xué)習(xí)器284
945評估學(xué)習(xí)器的表現(xiàn)286
946機器學(xué)習(xí)管道的威力286
947手動優(yōu)化288
948交叉驗證291
95小結(jié)293
附錄介紹GPU和Theano294

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號