大模型RAG應用開發(fā)：構(gòu)建智能生成系統(tǒng)

定　價：￥99.00

作　者：	凌峰
出版社：	清華大學出版社
叢編項：
標　簽：	暫缺

購買這本書可以去

當當網(wǎng) (￥78.20)

ISBN：	9787302685982	出版時間：	2025-04-01	包裝：	平裝-膠訂
開本：	16開	頁數(shù)：		字數(shù)：

內(nèi)容簡介

　　《大模型RAG應用開發(fā)：構(gòu)建智能生成系統(tǒng)》系統(tǒng)介紹檢索增強生成（RAG）技術(shù)的核心概念、開發(fā)流程和實際應用?！洞竽Ｐ蚏AG應用開發(fā)：構(gòu)建智能生成系統(tǒng)》共分為11章，第1～3章詳細介紹RAG開發(fā)的基礎(chǔ)，包括環(huán)境搭建、常用工具和模塊，幫助讀者從零開始理解RAG系統(tǒng)的工作原理與開發(fā)技巧；第4～8章聚焦RAG系統(tǒng)的具體搭建，從向量數(shù)據(jù)庫的創(chuàng)建、文本的向量化，到如何構(gòu)建高效的檢索增強模型，為開發(fā)RAG應用奠定基礎(chǔ)；第9～11章通過實際案例，包括企業(yè)文檔問答系統(tǒng)、醫(yī)療文獻檢索系統(tǒng)和法律法規(guī)查詢助手的實際開發(fā)，幫助讀者在特定領(lǐng)域深入理解和應用RAG技術(shù)?！洞竽Ｐ蚏AG應用開發(fā)：構(gòu)建智能生成系統(tǒng)》適合RAG技術(shù)初學者、大模型和AI研發(fā)人員、數(shù)據(jù)分析和挖掘工程師，以及高年級本科生和研究生閱讀，也可作為培訓機構(gòu)和高校相關(guān)課程的教學用書或參考書。

作者簡介

　　凌峰，博士，目前就職于某985高校，長期從事機器學習、人工智能、計算機視覺與大模型領(lǐng)域的研發(fā)與教學，在模型優(yōu)化、訓練加速、數(shù)據(jù)驅(qū)動算法開發(fā)等方面有深刻見解，參與并主導多項相關(guān)科研項目。

圖書目錄

第 1 章搭建RAG開發(fā)環(huán)境 1
1.1 Python開發(fā)環(huán)境搭建 1
1.1.1 虛擬環(huán)境的創(chuàng)建管理 1
1.1.2 IDE的選擇與工作流的搭建 5
1.1.3 依賴庫安裝與版本管理 8
1.2 RAG開發(fā)中常用的Python依賴庫 10
1.2.1 數(shù)據(jù)處理庫：Pandas與NumPy 10
1.2.2 自然語言處理工具：NLTK與spaCy 13
1.2.3 向量檢索與模型處理：FAISS與Transformers庫簡介 16
1.3 RAG開發(fā)中常用的外部模塊 20
1.3.1 數(shù)據(jù)采集與預處理：Requests與BeautifulSoup 20
1.3.2 并行與異步處理：Multiprocessing與Asyncio 24
1.4 RAG與智能體 28
1.4.1 智能體的基本定義與作用 28
1.4.2 智能體的類型：反應型、認知型與學習型 30
1.5 基于RAG的智能體開發(fā)基礎(chǔ) 31
1.5.1 開發(fā)環(huán)境與工具 32
1.5.2 智能體開發(fā)中的關(guān)鍵算法：搜索、優(yōu)化與規(guī)劃 35
1.5.3 智能體的性能評估與調(diào)試方法 37
1.6 本章小結(jié) 40
1.7 思考題 41
第 2 章傳統(tǒng)生成與檢索增強生成 42
2.1 生成式AI和RAG的基本概念 42
2.1.1 生成式AI的核心原理與工作機制 43
2.1.2 生成檢索結(jié)合 45
2.1.3 檢索增強與傳統(tǒng)生成模型的區(qū)別 48
2.2 為何需要對傳統(tǒng)大模型進行檢索增強 51
2.2.1 預訓練大模型的瓶頸 52
2.2.2 RAG在實時信息處理中的優(yōu)勢 53
2.3 檢索增強核心：預訓練大模型 53
2.3.1 Transformer架構(gòu)的崛起：語言模型背后的核心引擎 54
2.3.2 從BERT到GPT-4：大模型發(fā)展的重要里程碑 56
2.4 本章小結(jié) 57
2.5 思考題 57
第 3 章 RAG模型的工作原理 59
3.1 檢索模塊與生成模塊 59
3.1.1 檢索模塊的核心功能與數(shù)據(jù)流 59
3.1.2 生成模塊在內(nèi)容創(chuàng)建中的作用 63
3.1.3 檢索與生成的協(xié)同工作機制 65
3.2 向量檢索：將文本轉(zhuǎn)換為向量 68
3.2.1 文本嵌入的基本原理與技術(shù) 69
3.2.2 高效向量檢索：從相似度到索引優(yōu)化 72
3.2.3 向量檢索在RAG中的實際應用 76
3.3 RAG開發(fā)中常用的生成模型簡介 80
3.3.1 GPT家族：從GPT-2到GPT-4的演進 80
3.3.2 BERT與T5：理解與生成的跨模型應用 82
3.4 本章小結(jié) 83
3.5 思考題 84
第 4 章搭建一個簡單的RAG系統(tǒng) 86
4.1 創(chuàng)建小型向量數(shù)據(jù)庫 86
4.1.1 數(shù)據(jù)準備與預處理：搭建數(shù)據(jù)庫的第一步 86
4.1.2 嵌入生成與存儲：從文本到向量的轉(zhuǎn)換 89
4.1.3 使用FAISS構(gòu)建檢索索引：實現(xiàn)高效查詢 92
4.2 利用公開模型實現(xiàn)簡單的問答系統(tǒng) 96
4.2.1 加載預訓練模型：選擇合適的生成模型 96
4.2.2 檢索與生成模塊的集成：構(gòu)建問答流程 100
4.2.3 測試與優(yōu)化：提升回答的準確性和一致性 103
4.3 本章小結(jié) 107
4.4 思考題 107
第 5 章數(shù)據(jù)向量化與FAISS開發(fā) 109
5.1 什么是向量檢索：原理與常用算法 109
5.1.1 向量檢索的基本概念：從相似性到距離度量 109
5.1.2 常用的向量檢索算法：線性搜索與近似最近鄰 113
5.1.3 向量檢索在RAG中的應用：增強上下文匹配 116
5.2 使用FAISS構(gòu)建高效的向量檢索系統(tǒng) 119
5.2.1 FAISS索引結(jié)構(gòu)解析：平面索引、倒排索引與產(chǎn)品量化 119
5.2.2 構(gòu)建和訓練FAISS索引：提高檢索速度和準確性 122
5.2.3 FAISS在大規(guī)模數(shù)據(jù)中的優(yōu)化策略：多級索引與分片 125
5.3 數(shù)據(jù)的向量化：Embedding的生成 128
5.3.1 嵌入生成模型選擇：如何匹配檢索任務需求 129
5.3.2 文本嵌入的生成與存儲：從編碼到持久化 131
5.4 本章小結(jié) 134
5.5 思考題 135
第 6 章文本檢索增強與上下文構(gòu)建 136
6.1 如何讓生成模型“理解”檢索到的內(nèi)容 136
6.1.1 檢索與生成的無縫銜接：內(nèi)容重構(gòu)與語義理解 136
6.1.2 語義相似度與匹配：提升生成的準確性 139
6.1.3 從檢索到生成的優(yōu)化路徑：模型理解的增強 141
6.2 上下文的構(gòu)建與傳遞 144
6.2.1 構(gòu)建有效的上下文：信息篩選與組織策略 145
6.2.2 多步上下文傳遞：保持生成內(nèi)容的連貫性 147
6.2.3 上下文優(yōu)化技巧：減少冗余與增加相關(guān)性 150
6.3 多輪對話與復雜生成任務的實現(xiàn) 154
6.3.1 多輪交互的構(gòu)建：讓生成模型模擬人類對話 154
6.3.2 長對話與上下文管理：模型記憶的實現(xiàn)方法 157
6.3.3 復雜生成任務分解：如何逐步實現(xiàn)多步驟生成 160
6.4 本章小結(jié) 164
6.5 思考題 165
第 7 章構(gòu)建檢索向量數(shù)據(jù)庫 167
7.1 數(shù)據(jù)的準備與清洗 167
7.1.1 數(shù)據(jù)質(zhì)量提升：數(shù)據(jù)清洗與規(guī)范化流程 167
7.1.2 數(shù)據(jù)標注與分類：構(gòu)建高效檢索的基礎(chǔ) 171
7.2 如何創(chuàng)建和管理向量數(shù)據(jù)庫 175
7.2.1 向量數(shù)據(jù)庫的構(gòu)建步驟：從嵌入到存儲 175
7.2.2 高效管理：向量索引與檢索優(yōu)化 178
7.3 本章小結(jié) 182
7.4 思考題 182
第 8 章針對延遲與緩存的模型性能調(diào)優(yōu) 184
8.1 調(diào)整生成與檢索模塊的協(xié)同參數(shù) 184
8.1.1 生成與檢索的平衡：優(yōu)化參數(shù)的核心原則 184
8.1.2 動態(tài)參數(shù)調(diào)節(jié)：提升響應質(zhì)量與精度 187
8.2 縮短RAG系統(tǒng)的響應時間 190
8.2.1 延遲分析與瓶頸定位：加速響應的第一步 191
8.2.2 緩存與并行處理策略：實現(xiàn)高效RAG系統(tǒng) 194
8.3 本章小結(jié) 197
8.4 思考題 197
第 9 章企業(yè)文檔問答系統(tǒng)的開發(fā) 199
9.1 需求分析與系統(tǒng)設(shè)計 199
9.1.1 確定問答系統(tǒng)的需求：識別用戶的主要查詢類型與目標 200
9.1.2 系統(tǒng)結(jié)構(gòu)與模塊劃分：明確檢索與生成模塊的協(xié)作方式 201
9.2 搭建向量數(shù)據(jù)庫與檢索模塊 201
9.2.1 數(shù)據(jù)預處理與向量化：生成高效的嵌入向量 202
9.2.2 構(gòu)建與優(yōu)化索引：提升檢索模塊的查詢速度 204
9.3 生成模塊的集成與模型調(diào)優(yōu) 206
9.3.1 加載與配置生成模型：選擇適合問答系統(tǒng)的生成模型 207
9.3.2 模型優(yōu)化與提示詞調(diào)優(yōu)：提高生成內(nèi)容的準確性與相關(guān)性 209
9.4 系統(tǒng)測試、部署與優(yōu)化 211
9.4.1 測試流程與性能監(jiān)控：確保系統(tǒng)的穩(wěn)定性與響應速度 211
9.4.2 企業(yè)環(huán)境的部署與上線：實現(xiàn)系統(tǒng)在實際業(yè)務中的應用 214
9.5 本章小結(jié) 222
9.6 思考題 222
第 10 章醫(yī)療文獻檢索與分析系統(tǒng)的開發(fā) 224
10.1 需求分析與數(shù)據(jù)準備 224
10.1.1 確定醫(yī)學文獻檢索需求：識別用戶查詢重點 225
10.1.2 數(shù)據(jù)收集與清洗：構(gòu)建高質(zhì)量的醫(yī)學知識庫 226
10.2 構(gòu)建高效的檢索模塊 232
10.2.1 設(shè)計向量檢索系統(tǒng)：提升檢索效率 232
10.2.2 優(yōu)化索引結(jié)構(gòu)：加速醫(yī)學文獻的精確匹配 235
10.3 生成模塊開發(fā)、集成和調(diào)優(yōu) 239
10.3.1 生成模型與檢索的集成：精準回答用戶提問 239
10.3.2 生成內(nèi)容的優(yōu)化與提示詞調(diào)優(yōu)：提升回答的質(zhì)量與專業(yè)性 241
10.4 本章小結(jié) 249
10.5 思考題 250
第 11 章法律法規(guī)查詢助手的開發(fā) 251
11.1 需求分析與數(shù)據(jù)收集 251
11.1.1 用戶需求解析：明確法律法規(guī)查詢的主要需求 252
11.1.2 法律法規(guī)數(shù)據(jù)源與收集方法：搭建全面的法規(guī)數(shù)據(jù)庫 253
11.1.3 數(shù)據(jù)清洗與標準化：提升查詢效率和準確性 253
11.2 法律法規(guī)檢索模塊的實現(xiàn) 257
11.2.1 向量化法律條款：構(gòu)建檢索友好的嵌入 257
11.2.2 FAISS索引在法規(guī)查詢中的應用：提升檢索性能 259
11.2.3 優(yōu)化檢索流程：提高法律條款的匹配精度 261
11.3 生成模塊開發(fā)與輸出優(yōu)化 264
11.3.1 生成模型與檢索模塊的集成：構(gòu)建準確的法規(guī)回答 265
11.3.2 輸出格式與內(nèi)容優(yōu)化：提供清晰的法律解釋 267
11.3.3 提示詞調(diào)優(yōu)與模型配置：確保法律回答的專業(yè)性 268
11.4 本章小結(jié) 273
11.5 思考題 273