注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)Effective數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施

Effective數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施

Effective數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施

定 價(jià):¥98.00

作 者: [芬] 維萊·圖洛斯(Ville Tuulos)著,郭濤 譯
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787302641865 出版時(shí)間: 2023-08-01 包裝: 平裝-膠訂
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  "數(shù)據(jù)科學(xué)項(xiàng)目日益增多,每個(gè)項(xiàng)目在提出原型到生產(chǎn)的過(guò)程中都需要可靠的基礎(chǔ)設(shè)施。使用《Effective數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施》介紹的一些新技術(shù)和新工具,你將能建立一個(gè)適用于各類(lèi)組織(無(wú)論是初創(chuàng)企業(yè)還是大型企業(yè))的基礎(chǔ)設(shè)施堆棧。 《Effective數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施》可幫助你建立數(shù)據(jù)流程和項(xiàng)目工作流,為你開(kāi)發(fā)項(xiàng)目帶來(lái)強(qiáng)大動(dòng)力?!禘ffective數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施》呈現(xiàn)Netflix數(shù)據(jù)操作的**進(jìn)工具和概念,并在此基礎(chǔ)上介紹一種可定制的基于云的模型開(kāi)發(fā)和MLOps方法,可輕松適應(yīng)公司的特定需求。當(dāng)團(tuán)隊(duì)把數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)應(yīng)用于廣泛的業(yè)務(wù)問(wèn)題時(shí),這些實(shí)用的數(shù)據(jù)流程將更高效地生成更完美的結(jié)果。 主要內(nèi)容 ● 在云中處理計(jì)算和編排 ● 將基于云的工具耦合到一個(gè)內(nèi)聚的數(shù)據(jù)科學(xué)環(huán)境中 ● 使用Metaflow、AWS和Python數(shù)據(jù)生態(tài)系統(tǒng)開(kāi)發(fā)可復(fù)制的數(shù)據(jù)科學(xué)項(xiàng)目 ● 構(gòu)建需要大型數(shù)據(jù)集和模型,需要數(shù)據(jù)科學(xué)家團(tuán)隊(duì)參與的復(fù)雜應(yīng)用程序"

作者簡(jiǎn)介

  Ville Tuulos在Netflix公司設(shè)計(jì)并構(gòu)建了用于數(shù)據(jù)科學(xué)的全??蚣躆etaflow。目前,Ville在一家專(zhuān)業(yè)開(kāi)發(fā)數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施的初創(chuàng)公司擔(dān)任首席執(zhí)行官。

圖書(shū)目錄

第1章  數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施介紹 1
1.1  選擇數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施的原因 2
1.2  什么是數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施 5
1.2.1  數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施堆棧 6
1.2.2  支持?jǐn)?shù)據(jù)科學(xué)項(xiàng)目的整個(gè)生命周期 8
1.2.3  不能以偏概全 9
1.3  良好基礎(chǔ)設(shè)施的重要性 10
1.3.1  管理復(fù)雜性 11
1.3.2  利用現(xiàn)有平臺(tái) 12
1.4  以人為中心的基礎(chǔ)設(shè)施 13
1.4.1  自由與責(zé)任 14
1.4.2  數(shù)據(jù)科學(xué)家自主性 15
1.5  本章小結(jié) 16
第2章  數(shù)據(jù)科學(xué)的工具鏈 17
2.1  建立開(kāi)發(fā)環(huán)境 18
2.1.1  云賬戶(hù) 21
2.1.2  數(shù)據(jù)科學(xué)工作站 22
2.1.3  筆記 24
2.1.4  歸納 27
2.2  介紹工作流 29
2.2.1  工作流基礎(chǔ) 30
2.2.2  執(zhí)行工作流 31
2.2.3  工作流框架 33
2.3  本章小結(jié) 35
第3章  Metaflow簡(jiǎn)介 37
3.1  Metaflow的基本概念 38
3.1.1  安裝Metaflow 39
3.1.2  編寫(xiě)基本工作流 40
3.1.3  管理工作流中的數(shù)據(jù)流 44
3.1.4  參數(shù) 50
3.2  分支和合并 55
3.2.1  有效的DAG結(jié)構(gòu) 56
3.2.2  靜態(tài)分支 57
3.2.3  動(dòng)態(tài)分支 61
3.2.4  控制并發(fā) 64
3.3  Metaflow實(shí)際應(yīng)用 66
3.3.1  啟動(dòng)新項(xiàng)目 67
3.3.2  使用客戶(hù)端API訪問(wèn)結(jié)果 69
3.3.3  調(diào)試故障 72
3.3.4  最后潤(rùn)色 76
3.4  本章小結(jié) 79
第4章  隨計(jì)算層伸縮 81
4.1  什么是可伸縮性 82
4.1.1  整個(gè)堆棧的可伸縮性 83
4.1.2  實(shí)驗(yàn)文化 85
4.2  計(jì)算層 87
4.2.1  使用容器進(jìn)行批處理 89
4.2.2  計(jì)算層示例 92
4.3  Metaflow中的計(jì)算層 98
4.3.1  為Metaflow配置AWS批處理 100
4.3.2  @batch和@resources裝飾器 104
4.4  處理故障 107
4.4.1  使用@retry從瞬態(tài)錯(cuò)誤中恢復(fù) 109
4.4.2  使用@timeout殺死僵尸 110
4.4.3  最后一種裝飾器:@catch 111
4.5  本章小結(jié) 113
第5章  實(shí)踐可伸縮性和性能 115
5.1  從簡(jiǎn)單開(kāi)始:垂直可伸縮性 116
5.1.1  示例:聚類(lèi)Yelp評(píng)論 117
5.1.2  實(shí)踐垂直可伸縮性 119
5.1.3  為什么選擇垂直可
伸縮性 124
5.2  實(shí)踐水平可伸縮性 126
5.2.1  為什么選擇水平可伸縮性 126
5.2.2  示例:超參數(shù)搜索 127
5.3  實(shí)施性能優(yōu)化 130
5.3.1  示例:計(jì)算共現(xiàn)矩陣 131
5.3.2  加快工作流的方法 139
5.4  本章小結(jié) 140
第6章  投入生產(chǎn) 141
6.1  穩(wěn)定的工作流調(diào)度 143
6.1.1  中心化元數(shù)據(jù) 145
6.1.2  使用AWS Step Functions和Metaflow 147
6.1.3  使用@schedule調(diào)度運(yùn)行 152
6.2  魯棒的執(zhí)行環(huán)境 153
6.2.1  Metaflow包如何流動(dòng) 155
6.2.2  為什么依賴(lài)管理很重要 160
6.2.3  使用@conda裝飾器 162
6.3  穩(wěn)定運(yùn)行 167
6.3.1  原型開(kāi)發(fā)期間的命名空間 169
6.3.2  生產(chǎn)命名空間 173
6.3.3  使用@project的并行部署 174
6.4  本章小結(jié) 177
第7章  處理數(shù)據(jù) 179
7.1  快速數(shù)據(jù)的基礎(chǔ) 182
7.1.1  從S3加載數(shù)據(jù) 183
7.1.2  使用表格數(shù)據(jù) 188
7.1.3  內(nèi)存數(shù)據(jù)堆棧 192
7.2  與數(shù)據(jù)基礎(chǔ)設(shè)施的交互 194
7.2.1  現(xiàn)代數(shù)據(jù)基礎(chǔ)設(shè)施 195
7.2.2  用SQL準(zhǔn)備數(shù)據(jù)集 199
7.2.3  分布式數(shù)據(jù)處理 205
7.3  從數(shù)據(jù)到特征 210
7.3.1  區(qū)分事實(shí)和特征 211
7.3.2  編碼特征 213
7.4  本章小結(jié) 218
第8章  使用和操作模型 221
8.1  生成預(yù)測(cè) 223
8.1.1  批處理、流式和實(shí)時(shí)預(yù)測(cè) 225
8.1.2  示例:推薦系統(tǒng) 227
8.1.3  批處理預(yù)測(cè) 232
8.1.4  實(shí)時(shí)預(yù)測(cè) 243
8.2  本章小結(jié) 248
第9章  全棧機(jī)器學(xué)習(xí) 249
9.1  可插拔的特征編碼器和模型 250
9.1.1  為可插拔的組件開(kāi)發(fā)框架 251
9.1.2  執(zhí)行特征編碼器 255
9.1.3  基準(zhǔn)模型 259
9.2  深度回歸模型 264
9.2.1  編碼輸入張量 266
9.2.2  定義深度回歸模型 269
9.2.3  訓(xùn)練深度回歸模型 272
9.3  總結(jié)所學(xué) 275
9.4  本章小結(jié) 277
附錄  安裝Conda 279 
 

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)