ChatGPT原理與實(shí)戰(zhàn)：大型語(yǔ)言模型的算法、技術(shù)和私有化

定　價(jià)：￥99.00

作　者：	劉聰
出版社：	機(jī)械工業(yè)出版社
叢編項(xiàng)：
標(biāo)　簽：	暫缺

購(gòu)買(mǎi)這本書(shū)可以去

當(dāng)當(dāng)網(wǎng) (￥74.20)

ISBN：	9787111733034	出版時(shí)間：	2023-08-01	包裝：	平裝-膠訂
開(kāi)本：	16開(kāi)	頁(yè)數(shù)：		字?jǐn)?shù)：

內(nèi)容簡(jiǎn)介

　　這是一本系統(tǒng)梳理并深入解析ChatGPT核心技術(shù)、算法實(shí)現(xiàn)、工作原理、訓(xùn)練方法的著作，也是一本能指導(dǎo)你搭建專(zhuān)屬ChatGPT和實(shí)現(xiàn)大模型遷移及私有化的著作。本書(shū)得到了MOSS系統(tǒng)負(fù)責(zé)人邱錫鵬等多位專(zhuān)家的高度評(píng)價(jià)和鼎力推薦。具體地，通過(guò)本書(shū)你能了解或掌握以下知識(shí)：？ChatGPT的工作流程和技術(shù)棧？ChatGPT的工作原理和算法實(shí)現(xiàn)？基于Transformer架構(gòu)的一系列預(yù)訓(xùn)練語(yǔ)言模型的原理？強(qiáng)化學(xué)習(xí)的基礎(chǔ)知識(shí)？提示學(xué)習(xí)與大模型涌現(xiàn)出的上下文學(xué)習(xí)、思維鏈？大模型的訓(xùn)練方法及常見(jiàn)的分布式訓(xùn)練框架？基于人工反饋的強(qiáng)化學(xué)習(xí)整體框架？從零搭建類(lèi)ChatGPT模型，模擬完整的ChatGPT訓(xùn)練過(guò)程本書(shū)集理論、實(shí)戰(zhàn)和產(chǎn)業(yè)應(yīng)用于一體，提供大量經(jīng)詳細(xì)注釋的代碼，方便讀者理解和實(shí)操?？傊还芾锸窍肷钊胙芯緾hatGPT本身，還是正在研發(fā)或使用其他大模型，本書(shū)都應(yīng)該能給你頗具價(jià)值的技術(shù)啟發(fā)與思考，讓你在大模型的路上快速前行，少走彎路。

作者簡(jiǎn)介

暫缺《ChatGPT原理與實(shí)戰(zhàn)：大型語(yǔ)言模型的算法、技術(shù)和私有化》作者簡(jiǎn)介

圖書(shū)目錄

CONTENTS
目　錄
贊譽(yù)
前言
第1章　了解ChatGPT1
1.1　ChatGPT的由來(lái)1
1.1.1　什么是ChatGPT2
1.1.2　ChatGPT的發(fā)展歷史2
1.2　ChatGPT的工作流程3
1.3　ChatGPT用例3
1.3.1　日常任務(wù)4
1.3.2　編寫(xiě)代碼5
1.3.3　文本生成6
1.3.4　辦公自動(dòng)化9
1.4　本章小結(jié)10
第2章　ChatGPT原理解構(gòu)11
2.1　背景知識(shí)11
2.1.1　自然語(yǔ)言處理的發(fā)展歷程12
2.1.2　大型語(yǔ)言模型的發(fā)展歷程14
2.2　ChatGPT同類(lèi)產(chǎn)品18
2.2.1　BlenderBot 3.018
2.2.2　LaMDA20
2.2.3　Sparrow23
2.3　ChatGPT的工作原理25
2.3.1　預(yù)訓(xùn)練與提示學(xué)習(xí)階段26
2.3.2　結(jié)果評(píng)價(jià)與獎(jiǎng)勵(lì)建模階段28
2.3.3　強(qiáng)化學(xué)習(xí)與自我進(jìn)化階段28
2.4　算法細(xì)節(jié)29
2.4.1　標(biāo)注數(shù)據(jù)29
2.4.2　建模思路30
2.4.3　存在的問(wèn)題30
2.5　關(guān)于ChatGPT的思考31
2.6　本章小結(jié)32
第3章　預(yù)訓(xùn)練語(yǔ)言模型33
3.1　Transformer結(jié)構(gòu)33
3.2　基于Encoder結(jié)構(gòu)的模型36
3.2.1　BERT36
3.2.2　RoBERTa39
3.2.3　ERNIE40
3.2.4　SpanBERT42
3.2.5　MacBERT43
3.2.6　ALBERT44
3.2.7　NeZha45
3.2.8　UniLM46
3.2.9　GLM47
3.2.10　ELECTRA48
3.3　基于Decoder結(jié)構(gòu)的模型49
3.3.1　GPT49
3.3.2　CPM51
3.3.3　PaLM51
3.3.4　OPT52
3.3.5　Bloom53
3.3.6　LLaMA54
3.4　基于Encoder-Decoder結(jié)構(gòu)的模型55
3.4.1　MASS55
3.4.2　BART56
3.4.3　T557
3.5　基于夸夸閑聊數(shù)據(jù)的UniLM
　　　模型實(shí)戰(zhàn)59
3.5.1　項(xiàng)目簡(jiǎn)介59
3.5.2　數(shù)據(jù)預(yù)處理模塊59
3.5.3　UniLM模型模塊63
3.5.4　模型訓(xùn)練模塊65
3.5.5　模型推理模塊72
3.6　本章小結(jié)76
第4章　強(qiáng)化學(xué)習(xí)基礎(chǔ)77
4.1　機(jī)器學(xué)習(xí)的分類(lèi)77
4.1.1　有監(jiān)督學(xué)習(xí)78
4.1.2　無(wú)監(jiān)督學(xué)習(xí)78
4.1.3　強(qiáng)化學(xué)習(xí)79
4.2　OpenAI Gym82
4.2.1　OpenAI Gym API簡(jiǎn)介83
4.2.2　環(huán)境簡(jiǎn)介84
4.3　強(qiáng)化學(xué)習(xí)算法85
4.3.1　Q-learning算法85
4.3.2　SARSA算法87
4.3.3　DQN算法89
4.3.4　Policy Gradient算法93
4.3.5　Actor-Critic算法95
4.4　本章小結(jié)98
第5章　提示學(xué)習(xí)與大型語(yǔ)言
　　　　模型的涌現(xiàn)99
5.1　提示學(xué)習(xí)99
5.1.1　什么是提示學(xué)習(xí)100
5.1.2　提示模板設(shè)計(jì)100
5.1.3　答案空間映射設(shè)計(jì)102
5.1.4　多提示學(xué)習(xí)方法103
5.2　上下文學(xué)習(xí)104
5.2.1　什么是上下文學(xué)習(xí)104
5.2.2　預(yù)訓(xùn)練階段提升上下文
　　　學(xué)習(xí)能力105
5.2.3　推理階段優(yōu)化上下文
　　　學(xué)習(xí)的效果107
5.3　思維鏈108
5.4　基于提示的文本情感分析實(shí)戰(zhàn)113
5.4.1　項(xiàng)目簡(jiǎn)介113
5.4.2　數(shù)據(jù)預(yù)處理模塊114
5.4.3　BERT模型模塊115
5.4.4　模型訓(xùn)練模塊118
5.4.5　模型推理模塊128
5.5　本章小結(jié)131
第6章　大型語(yǔ)言模型預(yù)訓(xùn)練132
6.1　大型預(yù)訓(xùn)練模型簡(jiǎn)介132
6.2　預(yù)訓(xùn)練模型中的分詞器133
6.2.1　BPE133
6.2.2　WordPiece135
6.2.3　Unigram136
6.2.4　SentencePiece137
6.3　分布式深度學(xué)習(xí)框架138
6.3.1　并行范式簡(jiǎn)介139
6.3.2　Megatron-LM145
6.3.3　DeepSpeed147
6.3.4　Colossal-AI149
6.3.5　FairScale152
6.3.6　ParallelFormers153
6.3.7　OneFlow153
6.4　基于大型語(yǔ)言模型的預(yù)訓(xùn)練實(shí)戰(zhàn)155
6.4.1　項(xiàng)目簡(jiǎn)介155
6.4.2　數(shù)據(jù)預(yù)處理模塊156
6.4.3　執(zhí)行模型訓(xùn)練159
6.5　基于大型語(yǔ)言模型的信息
　　抽取實(shí)戰(zhàn)168
6.5.1　項(xiàng)目簡(jiǎn)介168
6.5.2　數(shù)據(jù)預(yù)處理模塊169
6.5.3　Freeze微調(diào)模塊172
6.5.4　LoRA微調(diào)模塊176
6.5.5　P-Tuning v2微調(diào)模塊181
6.6　本章小結(jié)186
第7章　GPT系列模型分析187
7.1　GPT-1～GPT-4系列模型分析187
7.1.1　GPT-1和GPT-2模型187
7.1.2　GPT-3模型189
7.1.3　GPT-3的衍生模型：
　　　　　　Code-X192
7.1.4　GPT-4模型193
7.2　InstructGPT模型分析194
7.2.1　模型簡(jiǎn)介194
7.2.2　數(shù)據(jù)收集195
7.2.3　模型原理198
7.2.4　模型討論199
7.3　基于GPT-2模型的文本摘要實(shí)戰(zhàn)200
7.3.1　項(xiàng)目簡(jiǎn)介200
7.3.2　數(shù)據(jù)預(yù)處理模塊200
7.3.3　GPT-2模型模塊202
7.3.4　模型訓(xùn)練模塊204
7.3.5　模型推理模塊213
7.4　本章小結(jié)219
第8章　PPO算法與RLHF理論實(shí)戰(zhàn)220
8.1　PPO算法簡(jiǎn)介220
8.1.1　策略梯度算法回顧220
8.1.2　PPO算法原理剖析222
8.1.3　PPO算法對(duì)比與評(píng)價(jià)224
8.2　RLHF框架簡(jiǎn)介226
8.2.1　RLHF內(nèi)部剖析226
8.2.2　RLHF價(jià)值分析228
8.2.3　RLHF問(wèn)題分析229
8.3　基于PPO的正向情感傾向性
　　　　生成項(xiàng)目實(shí)戰(zhàn)230
8.3.1　項(xiàng)目任務(wù)與數(shù)據(jù)集分析230
8.3.2　數(shù)據(jù)預(yù)處理模塊230
8.3.3　模型訓(xùn)練模塊232
8.3.4　模型生成模塊234
8.3.5　模型評(píng)估模塊235
8.4　問(wèn)題與思考237
8.5　本章小結(jié)238
第9章　類(lèi)ChatGPT實(shí)戰(zhàn)239
9.1　任務(wù)設(shè)計(jì)239
9.2　數(shù)據(jù)準(zhǔn)備240
9.3　基于文檔生成問(wèn)題任務(wù)的類(lèi)
　　　　　ChatGPT實(shí)戰(zhàn)241
9.3.1　SFT階段241
9.3.2　RM階段249
9.3.3　RL階段259
9.4　本章小結(jié)270
第10章　ChatGPT發(fā)展趨勢(shì)271
10.1　AIGC的發(fā)展趨勢(shì)271
10.1.1　AI云邊協(xié)同272
10.1.2　AI工具應(yīng)用273
10.1.3　AI可控生成274
10.1.4　AI輔助決策275
10.2　ChatGPT 2C應(yīng)用場(chǎng)景276
10.2.1