注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡(luò)操作系統(tǒng)大模型RAG應用開發(fā):構(gòu)建智能生成系統(tǒng)

大模型RAG應用開發(fā):構(gòu)建智能生成系統(tǒng)

大模型RAG應用開發(fā):構(gòu)建智能生成系統(tǒng)

定 價:¥99.00

作 者: 凌峰
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302685982 出版時間: 2025-04-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字數(shù):  

內(nèi)容簡介

  《大模型RAG應用開發(fā):構(gòu)建智能生成系統(tǒng)》系統(tǒng)介紹檢索增強生成(RAG)技術(shù)的核心概念、開發(fā)流程和實際應用?!洞竽P蚏AG應用開發(fā):構(gòu)建智能生成系統(tǒng)》共分為11章,第1~3章詳細介紹RAG開發(fā)的基礎(chǔ),包括環(huán)境搭建、常用工具和模塊,幫助讀者從零開始理解RAG系統(tǒng)的工作原理與開發(fā)技巧;第4~8章聚焦RAG系統(tǒng)的具體搭建,從向量數(shù)據(jù)庫的創(chuàng)建、文本的向量化,到如何構(gòu)建高效的檢索增強模型,為開發(fā)RAG應用奠定基礎(chǔ);第9~11章通過實際案例,包括企業(yè)文檔問答系統(tǒng)、醫(yī)療文獻檢索系統(tǒng)和法律法規(guī)查詢助手的實際開發(fā),幫助讀者在特定領(lǐng)域深入理解和應用RAG技術(shù)?!洞竽P蚏AG應用開發(fā):構(gòu)建智能生成系統(tǒng)》適合RAG技術(shù)初學者、大模型和AI研發(fā)人員、數(shù)據(jù)分析和挖掘工程師,以及高年級本科生和研究生閱讀,也可作為培訓機構(gòu)和高校相關(guān)課程的教學用書或參考書。

作者簡介

  凌峰,博士,目前就職于某985高校,長期從事機器學習、人工智能、計算機視覺與大模型領(lǐng)域的研發(fā)與教學,在模型優(yōu)化、訓練加速、數(shù)據(jù)驅(qū)動算法開發(fā)等方面有深刻見解,參與并主導多項相關(guān)科研項目。

圖書目錄

第 1 章  搭建RAG開發(fā)環(huán)境 1
1.1  Python開發(fā)環(huán)境搭建 1
1.1.1  虛擬環(huán)境的創(chuàng)建管理 1
1.1.2  IDE的選擇與工作流的搭建 5
1.1.3  依賴庫安裝與版本管理 8
1.2  RAG開發(fā)中常用的Python依賴庫 10
1.2.1  數(shù)據(jù)處理庫:Pandas與NumPy 10
1.2.2  自然語言處理工具:NLTK與spaCy 13
1.2.3  向量檢索與模型處理:FAISS與Transformers庫簡介 16
1.3  RAG開發(fā)中常用的外部模塊 20
1.3.1  數(shù)據(jù)采集與預處理:Requests與BeautifulSoup 20
1.3.2  并行與異步處理:Multiprocessing與Asyncio 24
1.4  RAG與智能體 28
1.4.1  智能體的基本定義與作用 28
1.4.2  智能體的類型:反應型、認知型與學習型 30
1.5  基于RAG的智能體開發(fā)基礎(chǔ) 31
1.5.1  開發(fā)環(huán)境與工具 32
1.5.2  智能體開發(fā)中的關(guān)鍵算法:搜索、優(yōu)化與規(guī)劃 35
1.5.3  智能體的性能評估與調(diào)試方法 37
1.6  本章小結(jié) 40
1.7  思考題 41
第 2 章  傳統(tǒng)生成與檢索增強生成 42
2.1  生成式AI和RAG的基本概念 42
2.1.1  生成式AI的核心原理與工作機制 43
2.1.2  生成檢索結(jié)合 45
2.1.3  檢索增強與傳統(tǒng)生成模型的區(qū)別 48
2.2  為何需要對傳統(tǒng)大模型進行檢索增強 51
2.2.1  預訓練大模型的瓶頸 52
2.2.2  RAG在實時信息處理中的優(yōu)勢 53
2.3  檢索增強核心:預訓練大模型 53
2.3.1  Transformer架構(gòu)的崛起:語言模型背后的核心引擎 54
2.3.2  從BERT到GPT-4:大模型發(fā)展的重要里程碑 56
2.4  本章小結(jié) 57
2.5  思考題 57
第 3 章  RAG模型的工作原理 59
3.1  檢索模塊與生成模塊 59
3.1.1  檢索模塊的核心功能與數(shù)據(jù)流 59
3.1.2  生成模塊在內(nèi)容創(chuàng)建中的作用 63
3.1.3  檢索與生成的協(xié)同工作機制 65
3.2  向量檢索:將文本轉(zhuǎn)換為向量 68
3.2.1  文本嵌入的基本原理與技術(shù) 69
3.2.2  高效向量檢索:從相似度到索引優(yōu)化 72
3.2.3  向量檢索在RAG中的實際應用 76
3.3  RAG開發(fā)中常用的生成模型簡介 80
3.3.1  GPT家族:從GPT-2到GPT-4的演進 80
3.3.2  BERT與T5:理解與生成的跨模型應用 82
3.4  本章小結(jié) 83
3.5  思考題 84
第 4 章  搭建一個簡單的RAG系統(tǒng) 86
4.1  創(chuàng)建小型向量數(shù)據(jù)庫 86
4.1.1  數(shù)據(jù)準備與預處理:搭建數(shù)據(jù)庫的第一步 86
4.1.2  嵌入生成與存儲:從文本到向量的轉(zhuǎn)換 89
4.1.3  使用FAISS構(gòu)建檢索索引:實現(xiàn)高效查詢 92
4.2  利用公開模型實現(xiàn)簡單的問答系統(tǒng) 96
4.2.1  加載預訓練模型:選擇合適的生成模型 96
4.2.2  檢索與生成模塊的集成:構(gòu)建問答流程 100
4.2.3  測試與優(yōu)化:提升回答的準確性和一致性 103
4.3  本章小結(jié) 107
4.4  思考題 107
第 5 章  數(shù)據(jù)向量化與FAISS開發(fā) 109
5.1  什么是向量檢索:原理與常用算法 109
5.1.1  向量檢索的基本概念:從相似性到距離度量 109
5.1.2  常用的向量檢索算法:線性搜索與近似最近鄰 113
5.1.3  向量檢索在RAG中的應用:增強上下文匹配 116
5.2  使用FAISS構(gòu)建高效的向量檢索系統(tǒng) 119
5.2.1  FAISS索引結(jié)構(gòu)解析:平面索引、倒排索引與產(chǎn)品量化 119
5.2.2  構(gòu)建和訓練FAISS索引:提高檢索速度和準確性 122
5.2.3  FAISS在大規(guī)模數(shù)據(jù)中的優(yōu)化策略:多級索引與分片 125
5.3  數(shù)據(jù)的向量化:Embedding的生成 128
5.3.1  嵌入生成模型選擇:如何匹配檢索任務需求 129
5.3.2  文本嵌入的生成與存儲:從編碼到持久化 131
5.4  本章小結(jié) 134
5.5  思考題 135
第 6 章  文本檢索增強與上下文構(gòu)建 136
6.1  如何讓生成模型“理解”檢索到的內(nèi)容 136
6.1.1  檢索與生成的無縫銜接:內(nèi)容重構(gòu)與語義理解 136
6.1.2  語義相似度與匹配:提升生成的準確性 139
6.1.3  從檢索到生成的優(yōu)化路徑:模型理解的增強 141
6.2  上下文的構(gòu)建與傳遞 144
6.2.1  構(gòu)建有效的上下文:信息篩選與組織策略 145
6.2.2  多步上下文傳遞:保持生成內(nèi)容的連貫性 147
6.2.3  上下文優(yōu)化技巧:減少冗余與增加相關(guān)性 150
6.3  多輪對話與復雜生成任務的實現(xiàn) 154
6.3.1  多輪交互的構(gòu)建:讓生成模型模擬人類對話 154
6.3.2  長對話與上下文管理:模型記憶的實現(xiàn)方法 157
6.3.3  復雜生成任務分解:如何逐步實現(xiàn)多步驟生成 160
6.4  本章小結(jié) 164
6.5  思考題 165
第 7 章  構(gòu)建檢索向量數(shù)據(jù)庫 167
7.1  數(shù)據(jù)的準備與清洗 167
7.1.1  數(shù)據(jù)質(zhì)量提升:數(shù)據(jù)清洗與規(guī)范化流程 167
7.1.2  數(shù)據(jù)標注與分類:構(gòu)建高效檢索的基礎(chǔ) 171
7.2  如何創(chuàng)建和管理向量數(shù)據(jù)庫 175
7.2.1  向量數(shù)據(jù)庫的構(gòu)建步驟:從嵌入到存儲 175
7.2.2  高效管理:向量索引與檢索優(yōu)化 178
7.3  本章小結(jié) 182
7.4  思考題 182
第 8 章  針對延遲與緩存的模型性能調(diào)優(yōu) 184
8.1  調(diào)整生成與檢索模塊的協(xié)同參數(shù) 184
8.1.1  生成與檢索的平衡:優(yōu)化參數(shù)的核心原則 184
8.1.2  動態(tài)參數(shù)調(diào)節(jié):提升響應質(zhì)量與精度 187
8.2  縮短RAG系統(tǒng)的響應時間 190
8.2.1  延遲分析與瓶頸定位:加速響應的第一步 191
8.2.2  緩存與并行處理策略:實現(xiàn)高效RAG系統(tǒng) 194
8.3  本章小結(jié) 197
8.4  思考題 197
第 9 章  企業(yè)文檔問答系統(tǒng)的開發(fā) 199
9.1  需求分析與系統(tǒng)設(shè)計 199
9.1.1  確定問答系統(tǒng)的需求:識別用戶的主要查詢類型與目標 200
9.1.2  系統(tǒng)結(jié)構(gòu)與模塊劃分:明確檢索與生成模塊的協(xié)作方式 201
9.2  搭建向量數(shù)據(jù)庫與檢索模塊 201
9.2.1  數(shù)據(jù)預處理與向量化:生成高效的嵌入向量 202
9.2.2  構(gòu)建與優(yōu)化索引:提升檢索模塊的查詢速度 204
9.3  生成模塊的集成與模型調(diào)優(yōu) 206
9.3.1  加載與配置生成模型:選擇適合問答系統(tǒng)的生成模型 207
9.3.2  模型優(yōu)化與提示詞調(diào)優(yōu):提高生成內(nèi)容的準確性與相關(guān)性 209
9.4  系統(tǒng)測試、部署與優(yōu)化 211
9.4.1  測試流程與性能監(jiān)控:確保系統(tǒng)的穩(wěn)定性與響應速度 211
9.4.2  企業(yè)環(huán)境的部署與上線:實現(xiàn)系統(tǒng)在實際業(yè)務中的應用 214
9.5  本章小結(jié) 222
9.6  思考題 222
第 10 章  醫(yī)療文獻檢索與分析系統(tǒng)的開發(fā) 224
10.1  需求分析與數(shù)據(jù)準備 224
10.1.1  確定醫(yī)學文獻檢索需求:識別用戶查詢重點 225
10.1.2  數(shù)據(jù)收集與清洗:構(gòu)建高質(zhì)量的醫(yī)學知識庫 226
10.2  構(gòu)建高效的檢索模塊 232
10.2.1  設(shè)計向量檢索系統(tǒng):提升檢索效率 232
10.2.2  優(yōu)化索引結(jié)構(gòu):加速醫(yī)學文獻的精確匹配 235
10.3  生成模塊開發(fā)、集成和調(diào)優(yōu) 239
10.3.1  生成模型與檢索的集成:精準回答用戶提問 239
10.3.2  生成內(nèi)容的優(yōu)化與提示詞調(diào)優(yōu):提升回答的質(zhì)量與專業(yè)性 241
10.4  本章小結(jié) 249
10.5  思考題 250
第 11 章  法律法規(guī)查詢助手的開發(fā) 251
11.1  需求分析與數(shù)據(jù)收集 251
11.1.1  用戶需求解析:明確法律法規(guī)查詢的主要需求 252
11.1.2  法律法規(guī)數(shù)據(jù)源與收集方法:搭建全面的法規(guī)數(shù)據(jù)庫 253
11.1.3  數(shù)據(jù)清洗與標準化:提升查詢效率和準確性 253
11.2  法律法規(guī)檢索模塊的實現(xiàn) 257
11.2.1  向量化法律條款:構(gòu)建檢索友好的嵌入 257
11.2.2  FAISS索引在法規(guī)查詢中的應用:提升檢索性能 259
11.2.3  優(yōu)化檢索流程:提高法律條款的匹配精度 261
11.3  生成模塊開發(fā)與輸出優(yōu)化 264
11.3.1  生成模型與檢索模塊的集成:構(gòu)建準確的法規(guī)回答 265
11.3.2  輸出格式與內(nèi)容優(yōu)化:提供清晰的法律解釋 267
11.3.3  提示詞調(diào)優(yōu)與模型配置:確保法律回答的專業(yè)性 268
11.4  本章小結(jié) 273
11.5  思考題 273

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號