注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)網(wǎng)絡(luò)與數(shù)據(jù)通信從零開(kāi)始構(gòu)建企業(yè)級(jí)推薦系統(tǒng)

從零開(kāi)始構(gòu)建企業(yè)級(jí)推薦系統(tǒng)

從零開(kāi)始構(gòu)建企業(yè)級(jí)推薦系統(tǒng)

定 價(jià):¥89.00

作 者: 張相於 著
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787121391514 出版時(shí)間: 2020-07-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 320 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)是一本面向?qū)嵺`的企業(yè)級(jí)推薦系統(tǒng)開(kāi)發(fā)指南,內(nèi)容包括產(chǎn)品設(shè)計(jì)、相關(guān)性算法、排序模型、工程架構(gòu)、效果評(píng)測(cè)、系統(tǒng)監(jiān)控等推薦系統(tǒng)核心部分的設(shè)計(jì)與開(kāi)發(fā),可以幫助開(kāi)發(fā)者逐步構(gòu)建一個(gè)完整的推薦系統(tǒng),并提供了持續(xù)優(yōu)化的系統(tǒng)性思路。本書(shū)注重從系統(tǒng)性和通用性的角度看待推薦系統(tǒng)的核心問(wèn)題,希望能夠幫助讀者做到知其然,也知其所以然,更能夠舉一反三,真正掌握推薦系統(tǒng)的核心本質(zhì)。此外,本書(shū)對(duì)于推薦系統(tǒng)開(kāi)發(fā)中常見(jiàn)的問(wèn)題和陷阱,以及系統(tǒng)構(gòu)建過(guò)程,也做了重點(diǎn)介紹,力求讓讀者不僅知道做什么,而且知道怎么做。本書(shū)的目標(biāo)讀者是推薦系統(tǒng)研發(fā)工程師、產(chǎn)品經(jīng)理以及對(duì)推薦系統(tǒng)感興趣的學(xué)生和從業(yè)者。

作者簡(jiǎn)介

  張相於,本科和研究生畢業(yè)于中國(guó)人民大學(xué),現(xiàn)任阿里巴巴高級(jí)算法專家。多年來(lái)一直從事推薦系統(tǒng)及相關(guān)領(lǐng)域的系統(tǒng)研發(fā),具有豐富的實(shí)踐經(jīng)驗(yàn),并樂(lè)于分享經(jīng)驗(yàn)與教訓(xùn),在ResysChina上發(fā)表過(guò)多篇推薦系統(tǒng)相關(guān)文章,也在全球架構(gòu)師峰會(huì)等技術(shù)大會(huì)上做過(guò)多次演講。

圖書(shū)目錄

第1章 推薦系統(tǒng)的時(shí)代背景 1
1.1 為什么需要推薦系統(tǒng) 1
1.1.1 提高流量利用效率 1
1.1.2 挖掘和匹配長(zhǎng)尾需求 6
1.1.3 提升用戶體驗(yàn) 7
1.1.4 技術(shù)積累 8
1.2 推薦的產(chǎn)品問(wèn)題 10
1.2.1 推薦什么東西 10
1.2.2 為誰(shuí)推薦 13
1.2.3 推薦場(chǎng)景 14
1.2.4 推薦解釋 16
1.3 總結(jié) 18
第2章 推薦系統(tǒng)的核心技術(shù)概述 19
2.1 核心邏輯拆解 19
2.2 整體流程概述 20
2.3 召回算法 21
2.4 基于行為的召回算法 24
2.5 用戶畫(huà)像和物品畫(huà)像 24
2.6 結(jié)果排序 26
2.7 評(píng)價(jià)指標(biāo) 26
2.8 系統(tǒng)監(jiān)控 27
2.9 架構(gòu)設(shè)計(jì) 28
2.10 發(fā)展歷程 28
2.11 總結(jié) 30
第3章 基礎(chǔ)推薦算法 31
3.1 推薦邏輯流程架構(gòu) 31
3.2 召回算法的基本邏輯 34
3.3 常用的基礎(chǔ)召回算法 36
3.3.1 用戶與物品的相關(guān)性 36
3.3.2 物品與物品的相關(guān)性 42
3.3.3 用戶與用戶的相關(guān)性 46
3.3.4 用戶與標(biāo)簽的相關(guān)性 47
3.3.5 標(biāo)簽與物品的相關(guān)性 48
3.3.6 相關(guān)性召回的鏈?zhǔn)浇M合 50
3.4 冷啟動(dòng)場(chǎng)景下的推薦 51
3.5 總結(jié) 53
第4章 算法融合與數(shù)據(jù)血統(tǒng) 54
4.1 線性加權(quán)融合 55
4.2 優(yōu)先級(jí)融合 57
4.3 基于機(jī)器學(xué)習(xí)的排序融合 59
4.4 融合策略的選擇 61
4.5 融合時(shí)機(jī)的選擇 63
4.6 數(shù)據(jù)血統(tǒng) 64
4.6.1 融合策略正確性驗(yàn)證 65
4.6.2 系統(tǒng)效果監(jiān)控 65
4.6.3 策略效果分析 67
4.7 總結(jié) 68
第5章 機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用 69
5.1 機(jī)器學(xué)習(xí)技術(shù)概述 69
5.2 推薦系統(tǒng)中的應(yīng)用場(chǎng)景 70
5.3 機(jī)器學(xué)習(xí)技術(shù)的實(shí)施方法 72
5.3.1 老系統(tǒng)與數(shù)據(jù)準(zhǔn)備 72
5.3.2 問(wèn)題分析與目標(biāo)定義 74
5.3.3 樣本處理 76
5.3.4 特征處理 80
5.3.5 模型選擇與訓(xùn)練 98
5.3.6 模型效果評(píng)估 101
5.3.7 預(yù)測(cè)階段效果監(jiān)控 104
5.3.8 模型訓(xùn)練系統(tǒng)架構(gòu)設(shè)計(jì) 105
5.3.9 模型預(yù)測(cè)系統(tǒng)架構(gòu)設(shè)計(jì) 108
5.4 常用模型介紹 109
5.4.1 邏輯回歸模型 109
5.4.2 GBDT模型 111
5.4.3 LR+GDBT模型 112
5.4.4 因子分解機(jī)模型 113
5.4.5 Wide & Deep模型 115
5.4.6 其他深度學(xué)習(xí)模型 116
5.5 機(jī)器學(xué)習(xí)實(shí)踐常見(jiàn)問(wèn)題 117
5.5.1 反模式1:只見(jiàn)模型,不見(jiàn)系統(tǒng) 117
5.5.2 反模式2:忽視模型過(guò)程和細(xì)節(jié) 117
5.5.3 反模式3:不注重樣本精細(xì)化處理 118
5.5.4 反模式4:過(guò)于依賴算法 119
5.5.5 反模式5:核心數(shù)據(jù)缺乏控制 120
5.5.6 反模式6:團(tuán)隊(duì)不夠“全?!?121
5.5.7 反模式7:系統(tǒng)邊界模糊導(dǎo)致出現(xiàn)“巨型系統(tǒng)” 121
5.5.8 反模式8:不重視基礎(chǔ)數(shù)據(jù)架構(gòu)建設(shè) 122
5.6 總結(jié) 123
第6章 用戶畫(huà)像系統(tǒng) 124
6.1 用戶畫(huà)像的概念和作用 124
6.2 用戶畫(huà)像的價(jià)值準(zhǔn)則 126
6.3 用戶畫(huà)像的構(gòu)成要素 128
6.3.1 物品側(cè)畫(huà)像 129
6.3.2 用戶側(cè)畫(huà)像 133
6.3.3 用戶畫(huà)像擴(kuò)展 139
6.3.4 用戶畫(huà)像和排序特征的關(guān)系 142
6.4 用戶畫(huà)像系統(tǒng)的架構(gòu)演進(jìn) 143
6.4.1 用戶畫(huà)像系統(tǒng)的組成部分 143
6.4.2 野蠻生長(zhǎng)期 144
6.4.3 統(tǒng)一用戶畫(huà)像系統(tǒng)架構(gòu) 145
6.5 總結(jié) 147
第7章 系統(tǒng)效果評(píng)測(cè)與監(jiān)控 148
7.1 評(píng)測(cè)與監(jiān)控的概念和意義 148
7.2 推薦系統(tǒng)的評(píng)測(cè)指標(biāo)系統(tǒng) 150
7.3 常用指標(biāo) 151
7.4 離線效果評(píng)測(cè)方法 158
7.5 在線效果評(píng)測(cè)方法 163
7.5.1 AB實(shí)驗(yàn) 163
7.5.2 交叉實(shí)驗(yàn) 173
7.6 系統(tǒng)監(jiān)控 178
7.7 總結(jié) 181
第8章 推薦效果優(yōu)化 182
8.1 準(zhǔn)確率優(yōu)化的一般性思路 183
8.2 覆蓋率優(yōu)化的一般性思路 185
8.3 行為類相關(guān)性算法優(yōu)化 188
8.3.1 熱度懲罰 188
8.3.2 時(shí)效性優(yōu)化 190
8.3.3 隨機(jī)游走 194
8.3.4 嵌入表示 196
8.4 內(nèi)容類相關(guān)性算法優(yōu)化 200
8.4.1 非結(jié)構(gòu)化算法 201
8.4.2 結(jié)構(gòu)化算法 201
8.5 影響效果的非算法因素 205
8.5.1 用戶因素 205
8.5.2 產(chǎn)品設(shè)計(jì)因素 206
8.5.3 數(shù)據(jù)因素 208
8.5.4 算法策略因素 208
8.5.5 工程架構(gòu)因素 209
8.6 總結(jié) 210
第9章 自然語(yǔ)言處理技術(shù)的應(yīng)用 211
9.1 詞袋模型 212
9.2 權(quán)重計(jì)算和向量空間模型 214
9.3 隱語(yǔ)義模型 216
9.4 概率隱語(yǔ)義模型 218
9.5 生成式概率模型 220
9.6 LDA模型的應(yīng)用 222
9.6.1 相似度計(jì)算 222
9.6.2 排序特征 222
9.6.3 物品打標(biāo)簽&用戶打標(biāo)簽 223
9.6.4 主題&詞的重要性度量 223
9.6.5 更多應(yīng)用 224
9.7 神經(jīng)概率語(yǔ)言模型 224
9.8 行業(yè)應(yīng)用現(xiàn)狀 226
9.9 總結(jié)和展望 227
第10章 探索與利用問(wèn)題 228
10.1 多臂老虎機(jī)問(wèn)題 228
10.2 推薦系統(tǒng)中的EE問(wèn)題 230
10.3 解決方案 231
10.3.1 ?-Greedy算法 231
10.3.2 UCB 234
10.3.3 湯普森采樣 236
10.3.4 LinUCB 237
10.4 探索與利用原理在機(jī)器學(xué)習(xí)系統(tǒng)中的應(yīng)用 239
10.5 EE問(wèn)題的本質(zhì)和影響 240
10.6 總結(jié) 241
第11章 推薦系統(tǒng)架構(gòu)設(shè)計(jì) 242
11.1 架構(gòu)設(shè)計(jì)概述 242
11.2 系統(tǒng)邊界和外部依賴 244
11.3 離線層、在線層和近線層架構(gòu) 246
11.4 離線層架構(gòu) 247
11.5 近線層架構(gòu) 249
11.6 在線層架構(gòu) 252
11.7 架構(gòu)層級(jí)對(duì)比 255
11.8 系統(tǒng)和架構(gòu)演進(jìn)原則 256
11.8.1 從簡(jiǎn)單到復(fù)雜 256
11.8.2 從離線到在線 258
11.8.3 從統(tǒng)一到拆分 258
11.9 基于領(lǐng)域特定語(yǔ)言的架構(gòu)設(shè)計(jì) 259
11.10 總結(jié) 262
第12章 推薦系統(tǒng)工程師成長(zhǎng)路線 263
12.1 基礎(chǔ)開(kāi)發(fā)能力 264
12.1.1 單元測(cè)試 264
12.1.2 邏輯抽象復(fù)用 264
12.2 概率和統(tǒng)計(jì)基礎(chǔ) 265
12.3 機(jī)器學(xué)習(xí)理論 266
12.3.1 基礎(chǔ)理論 267
12.3.2 監(jiān)督學(xué)習(xí) 268
12.3.3 無(wú)監(jiān)督學(xué)習(xí) 269
12.4 開(kāi)發(fā)語(yǔ)言和開(kāi)發(fā)工具 270
12.4.1 開(kāi)發(fā)語(yǔ)言 270
12.4.2 開(kāi)發(fā)工具 270
12.5 算法優(yōu)化流程 271
12.6 推薦業(yè)務(wù)技能 273
12.7 總結(jié) 274
第13章 推薦系統(tǒng)的挑戰(zhàn) 275
13.1 數(shù)據(jù)稀疏性 275
13.2 推薦結(jié)果解釋 277
13.3 相關(guān)性和因果性 281
13.4 信息繭房 283
13.5 轉(zhuǎn)化率預(yù)估偏差問(wèn)題 286
13.6 召回模型的局限性問(wèn)題 288
13.7 用戶行為捕捉粒度問(wèn)題 290
13.8 總結(jié) 291

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)