注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)操作系統(tǒng)Alink權(quán)威指南:基于Flink的機(jī)器學(xué)習(xí)實(shí)例入門(Python)

Alink權(quán)威指南:基于Flink的機(jī)器學(xué)習(xí)實(shí)例入門(Python)

Alink權(quán)威指南:基于Flink的機(jī)器學(xué)習(xí)實(shí)例入門(Python)

定 價(jià):¥149.00

作 者: 楊旭
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787121431289 出版時(shí)間: 2022-03-01 包裝: 平塑
開本: 16開 頁數(shù): 476 字?jǐn)?shù):  

內(nèi)容簡介

  全書圍繞Alink(阿里在Flink基礎(chǔ)上做的開源版本)的展開,以實(shí)例為主闡述Alink的使用。?以機(jī)器學(xué)習(xí)的知識架構(gòu)將各個(gè)章節(jié)串聯(lián)起來,每個(gè)章節(jié)配合實(shí)例,用戶更容易理解和入手嘗試。?數(shù)據(jù)會采用讀者能免費(fèi)下載的數(shù)據(jù)集,在加上Alink本身是開源的、免費(fèi)的。用戶試用起來沒有成本。?實(shí)例實(shí)現(xiàn)的源代碼,準(zhǔn)備放在Alink開源git上,大家容易看到,可以直接下載,代碼旁邊會有實(shí)體書的介紹?以機(jī)器學(xué)習(xí)的知識架構(gòu)將各個(gè)章節(jié)串聯(lián)起來,每個(gè)章節(jié)配合實(shí)例,用戶更容易理解和入手嘗試。?數(shù)據(jù)會采用讀者能免費(fèi)下載的數(shù)據(jù)集,在加上Alink本身是開源的、免費(fèi)的。用戶試用起來沒有成本。?實(shí)例實(shí)現(xiàn)的源代碼,準(zhǔn)備放在Alink開源git上,大家容易看到,可以直接下載,代碼旁邊會有實(shí)體書的介紹

作者簡介

  2004年獲南開大學(xué)數(shù)學(xué)博士學(xué)位;隨后在南開大學(xué)信息學(xué)院從事博士后研究工作;2006年加入微軟亞洲研究院,進(jìn)行符號計(jì)算、大規(guī)模矩陣計(jì)算及機(jī)器學(xué)習(xí)算法研究;2010年加入阿里巴巴,從事大數(shù)據(jù)相關(guān)的統(tǒng)計(jì)和機(jī)器學(xué)習(xí)算法研發(fā)。著有《重構(gòu)大數(shù)據(jù)統(tǒng)計(jì)》《機(jī)器學(xué)習(xí)在線》等。

圖書目錄

目 錄
VII
目 錄
第1章 Alink快速上手 ...................................................................................................... 1
1.1 Alink是什么 ..............................................................................................................1
1.2 免費(fèi)下載、安裝 ........................................................................................................2
1.3 Alink的功能 ..............................................................................................................2
1.3.1 豐富的算法庫 ................................................................................................2
1.3.2 多樣的使用體驗(yàn) ............................................................................................3
1.3.3 與SparkML的對比 .......................................................................................4
1.4 關(guān)于數(shù)據(jù)和代碼 ........................................................................................................5
1.5 簡單示例 ....................................................................................................................6
1.5.1 數(shù)據(jù)的讀/寫與顯示 .......................................................................................6
1.5.2 批式訓(xùn)練和批式預(yù)測 ....................................................................................7
1.5.3 流式處理和流式預(yù)測 ..................................................................................10
1.5.4 定義Pipeline,簡化操作 ............................................................................ 11
1.5.5 嵌入預(yù)測服務(wù)系統(tǒng) ......................................................................................13
第2章 系統(tǒng)概況與核心概念 .......................................................................................... 15
2.1 基本概念 ..................................................................................................................15
2.2 批式任務(wù)與流式任務(wù) ..............................................................................................16
Alink 權(quán)威指南:基于 Flink 的機(jī)器學(xué)習(xí)實(shí)例入門(Python)
VIII
2.3 Alink=A+link ...........................................................................................................19
2.3.1 BatchOperator和StreamOperator ...............................................................20
2.3.2 link方式是批式算法/流式算法的通用使用方式 ......................................21
2.3.3 link的簡化 ...................................................................................................24
2.3.4 組件的主輸出與側(cè)輸出 ..............................................................................25
2.4 Pipeline與PipelineModel .......................................................................................25
2.4.1 概念和定義 ..................................................................................................25
2.4.2 深入介紹 ......................................................................................................27
2.5 觸發(fā)Alink任務(wù)的執(zhí)行 ...........................................................................................29
2.6 模型信息顯示 ..........................................................................................................31
2.7 文件系統(tǒng)與數(shù)據(jù)庫 ..................................................................................................35
2.8 Schema String ..........................................................................................................37
第3章 文件系統(tǒng)與數(shù)據(jù)文件 .......................................................................................... 39
3.1 文件系統(tǒng)簡介 ..........................................................................................................39
3.1.1 本地文件系統(tǒng) ..............................................................................................40
3.1.2 Hadoop文件系統(tǒng) .........................................................................................42
3.1.3 阿里云OSS文件系統(tǒng) .................................................................................44
3.2 數(shù)據(jù)文件的讀入與導(dǎo)出 ..........................................................................................46
3.2.1 CSV格式 .....................................................................................................47
3.2.2 TSV格式、LibSVM格式和Text格式 ......................................................54
3.2.3 AK格式 .......................................................................................................58
第4章 數(shù)據(jù)庫與數(shù)據(jù)表 .................................................................................................. 61
4.1 簡介 ..........................................................................................................................61
4.1.1 Catalog的基本操作 .....................................................................................61
4.1.2 Source組件和Sink組件 .............................................................................62
4.2 Hive示例 .................................................................................................................63
4.3 Derby示例 ...............................................................................................................66
4.4 MySQL示例 ............................................................................................................68
目 錄
IX
第5章 支持Flink SQL ................................................................................................... 70
5.1 基本操作 ..................................................................................................................70
5.1.1 注冊 ..............................................................................................................70
5.1.2 運(yùn)行 ..............................................................................................................71
5.1.3 內(nèi)置函數(shù) ......................................................................................................74
5.1.4 用戶定義函數(shù) ..............................................................................................74
5.2 簡化操作 ..................................................................................................................75
5.2.1 單表操作 ......................................................................................................76
5.2.2 兩表的連接(JOIN)操作 ..........................................................................80
5.2.3 兩表的集合操作 ..........................................................................................82
第6章 用戶定義函數(shù)(UDF/UDTF) ............................................................................ 87
6.1 用戶定義標(biāo)量函數(shù)(UDF) ..................................................................................87
6.1.1 示例數(shù)據(jù)及問題 ..........................................................................................88
6.1.2 UDF的定義 .................................................................................................88
6.1.3 使用UDF處理批式數(shù)據(jù) ............................................................................89
6.1.4 使用UDF處理流式數(shù)據(jù) ............................................................................90
6.2 用戶定義表值函數(shù)(UDTF) ...............................................................................92
6.2.1 示例數(shù)據(jù)及問題 ..........................................................................................92
6.2.2 UDTF的定義 ...............................................................................................92
6.2.3 使用UDTF處理批式數(shù)據(jù) ..........................................................................93

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號