注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)快速部署大模型:LLM策略與實(shí)踐(基于ChatGPT等大語(yǔ)言模型)

快速部署大模型:LLM策略與實(shí)踐(基于ChatGPT等大語(yǔ)言模型)

快速部署大模型:LLM策略與實(shí)踐(基于ChatGPT等大語(yǔ)言模型)

定 價(jià):¥79.00

作 者: [美]斯楠·奧茲德米爾(Sinan Ozdemir)著,姚普 白濤 卜崇宇 王蜀洪 譯
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書(shū)可以去


ISBN: 9787302661610 出版時(shí)間: 2024-06-01 包裝: 平裝-膠訂
開(kāi)本: 24開(kāi) 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)主要圍繞如何充分挖掘、利用大語(yǔ)言模型的潛力,囊括了大語(yǔ)言模型的概念,如何通過(guò)提示詞更好地利用大語(yǔ)言模型,大語(yǔ)言模型在信息檢索、推薦系統(tǒng)、視覺(jué)問(wèn)答等任務(wù)中的應(yīng)用,以及大語(yǔ)言模型的微調(diào)、多模態(tài)訓(xùn)練、模型生產(chǎn)應(yīng)用等高階使用技巧。本書(shū)在講解過(guò)程中搭配大量的應(yīng)用實(shí)例以及相關(guān)代碼,從大語(yǔ)言模型的概念、挖掘大語(yǔ)言模型潛力的方式到大語(yǔ)言模型的高級(jí)使用方式,讀者能夠?qū)⒏拍顚W(xué)習(xí)和實(shí)踐應(yīng)用同步進(jìn)行,是相關(guān)領(lǐng)域工程技術(shù)人員、學(xué)術(shù)人員以及對(duì)大語(yǔ)言模型感興趣的廣大讀者的不二之選。本書(shū)的內(nèi)容編排適合以下群體:(1) 有一定的編程能力,但對(duì)大語(yǔ)言模型沒(méi)有充分的認(rèn)知,想通過(guò)本書(shū)迅速掌握大語(yǔ)言模型的概念,并在相關(guān)業(yè)務(wù)領(lǐng)域(信息檢索、對(duì)話系統(tǒng)、推薦系統(tǒng)等)實(shí)現(xiàn)快速應(yīng)用。(2) 大語(yǔ)言模型某個(gè)研究領(lǐng)域的資深從業(yè)人員,但是想更全面地了解大語(yǔ)言模型在各個(gè)領(lǐng)域的研究應(yīng)用現(xiàn)狀,實(shí)現(xiàn)對(duì)大語(yǔ)言模型從學(xué)術(shù)研究到生產(chǎn)應(yīng)用的全方位系統(tǒng)認(rèn)知。

作者簡(jiǎn)介

  斯楠·奧茲德米爾(Sinan Ozdemir)擁有數(shù)學(xué)碩士學(xué)位,是一位成功的人工智能企業(yè)家和風(fēng)險(xiǎn)投資顧問(wèn)。在擔(dān)任約翰·霍普金斯大學(xué)講師期間,首次涉足數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí),并發(fā)明了人工智能領(lǐng)域的多項(xiàng)專利。后來(lái)創(chuàng)立了Kylie.ai——一個(gè)融合了對(duì)話式人工智能和機(jī)器人能力的創(chuàng)新平臺(tái)。Kylie.ai很快就因其獨(dú)特的價(jià)值主張而受到關(guān)注,最終被收購(gòu)。在此期間, 斯楠·奧茲德米爾開(kāi)始創(chuàng)作大量關(guān)于數(shù)據(jù)科學(xué)、人工智能和機(jī)器學(xué)習(xí)的作品。關(guān)于譯者姚普 中國(guó)科學(xué)院大學(xué)博士,現(xiàn)任京東資深算法工程師,多年從事算法設(shè)計(jì)與開(kāi)發(fā)、算法框架引擎開(kāi)發(fā)、算法產(chǎn)品化開(kāi)發(fā),在圖算法和大模型領(lǐng)域深耕多年,《圖深度學(xué)習(xí)從理論到實(shí)踐》作者。

圖書(shū)目錄

第1部分大模型介紹
第1章大模型概述
1.1什么是大模型
1.1.1大模型的定義
1.1.2大模型的關(guān)鍵特征
1.1.3大模型是如何工作的
1.2當(dāng)前流行的大模型
1.2.1BERT
1.2.2GPT3和 ChatGPT 
1.2.3T5
1.3垂直領(lǐng)域大模型
1.4大模型的應(yīng)用
1.4.1經(jīng)典的NLP任務(wù)
1.4.2自由文本生成
1.4.3信息檢索/神經(jīng)語(yǔ)意搜索
1.4.4聊天機(jī)器人
1.5本章小結(jié)
第2章大模型語(yǔ)義檢索
2.1簡(jiǎn)介
2.2語(yǔ)義檢索的任務(wù)
2.3非對(duì)稱語(yǔ)義檢索方案概述
2.4組件
2.4.1文本嵌入器
2.4.2文檔分塊
2.4.3向量數(shù)據(jù)庫(kù)
2.4.4Pinecone
2.4.5開(kāi)源替代方案
2.4.6檢索結(jié)果重排
2.4.7API
2.5完整方案
2.6閉源組件的成本
2.7本章小結(jié)
第3章提示詞工程入門
3.1簡(jiǎn)介
3.2提示詞工程
3.2.1LLM的對(duì)齊
3.2.2LLM提問(wèn)
3.2.3小樣本學(xué)習(xí)
3.2.4結(jié)構(gòu)化輸出
3.2.5人物角色提示詞
3.3跨模型提示詞工程
3.3.1ChatGPT 
3.3.2Cohere
3.3.3開(kāi)源提示詞工程
3.4采用ChatGPT構(gòu)建問(wèn)答機(jī)器人
3.5本章小結(jié)
第2部分充分挖掘大模型的潛力
第4章通過(guò)定制化微調(diào)優(yōu)化大模型
4.1簡(jiǎn)介
4.2遷移學(xué)習(xí)與微調(diào)入門
4.2.1微調(diào)過(guò)程的解釋
4.2.2閉源預(yù)訓(xùn)練模型作為基礎(chǔ)模型
4.3OpenAI 微調(diào) API 概覽
4.3.1GPT3微調(diào) API
4.3.2案例學(xué)習(xí): 亞馬遜評(píng)論情感分類
4.3.3數(shù)據(jù)指南和最佳實(shí)踐
4.4使用OpenAI CLI實(shí)現(xiàn)自定義數(shù)據(jù)微調(diào)
4.5設(shè)置 OpenAI CLI
4.6LLM微調(diào)實(shí)踐
4.6.1采用量化指標(biāo)評(píng)測(cè)大模型
4.6.2定性評(píng)估技術(shù)
4.6.3將微調(diào)的GPT3模型集成到應(yīng)用程序中
4.6.4案例學(xué)習(xí): 亞馬遜評(píng)論分類
4.7本章小結(jié)
第5章高級(jí)提示工程
5.1提示注入攻擊
5.2輸入/輸出驗(yàn)證
5.3批處理提示
5.4提示鏈
5.4.1提示鏈作為防御提示注入的手段
5.4.2使用提示鏈來(lái)防止提示填充
5.4.3使用提示鏈來(lái)安全地使用多模態(tài)LLM
5.5思維鏈提示
5.6重新審視小樣本學(xué)習(xí)
5.7測(cè)試和迭代快速開(kāi)發(fā)
5.8本章小結(jié)
第6章定制嵌入層和模型架構(gòu)
6.1案例研究: 構(gòu)建一個(gè)推薦系統(tǒng)
6.1.1定義問(wèn)題和數(shù)據(jù)
6.1.2推薦系統(tǒng)的定義
6.1.3基于萬(wàn)條用戶行為數(shù)據(jù)構(gòu)建推薦系統(tǒng)
6.1.4生成自定義字段來(lái)對(duì)比項(xiàng)目的相似性
6.1.5采用基礎(chǔ)詞向量構(gòu)建基線
6.1.6準(zhǔn)備微調(diào)數(shù)據(jù)
6.1.7使用Sentence Transformers微調(diào)開(kāi)源嵌入器
6.1.8微調(diào)效果總結(jié)
6.2本章小結(jié)
第3部分大模型的高級(jí)使用
第7章超越基礎(chǔ)模型
7.1案例研究: 視覺(jué)問(wèn)答
7.1.1模型簡(jiǎn)介: DistilBERT、視覺(jué)轉(zhuǎn)換器和GPT2
7.1.2隱藏狀態(tài)投影和融合
7.1.3交叉注意力是什么以及為什么至關(guān)重要
7.1.4定制多模式聯(lián)運(yùn)模型
7.1.5數(shù)據(jù): 視覺(jué)問(wèn)答
7.1.6VQA訓(xùn)練迭代
7.1.7結(jié)果總結(jié)
7.2案例研究: 從反饋中強(qiáng)化學(xué)習(xí)
7.2.1FLANT5模型
7.2.2獎(jiǎng)勵(lì)模型: 情感和語(yǔ)法正確性
7.2.3Transformer強(qiáng)化學(xué)習(xí)
7.2.4RLF訓(xùn)練循環(huán)
7.2.5結(jié)果總結(jié)
7.3本章小結(jié)
第8章開(kāi)源大模型的高級(jí)微調(diào)方法
8.1案例研究: 采用BERT對(duì)動(dòng)漫進(jìn)行多標(biāo)簽分類
8.1.1采用Jaccard相似分來(lái)評(píng)估動(dòng)漫標(biāo)題多標(biāo)簽分類的效果
8.1.2簡(jiǎn)單的微調(diào)大模型訓(xùn)練流程
8.1.3通用的開(kāi)源大模型微調(diào)技巧
8.1.4結(jié)果總結(jié)
8.2采用GPT2生成LaTeX
8.2.1開(kāi)源大模型的提示詞工程 
8.2.2結(jié)果總結(jié) 
8.3Sinan嘗試做出聰明而優(yōu)美的回應(yīng): SAWYER
8.3.1有監(jiān)督指令微調(diào) 
8.3.2獎(jiǎng)勵(lì)模型的訓(xùn)練 
8.3.3從(期望的)人類反饋中進(jìn)行強(qiáng)化學(xué)習(xí) 
8.3.4結(jié)果總結(jié) 
8.4日新月異的微調(diào)世界
8.5本章小結(jié)
第9章將LLM應(yīng)用于生產(chǎn)
9.1閉源LLM應(yīng)用于生產(chǎn)
9.2開(kāi)源LLM應(yīng)用于生產(chǎn)
9.2.1將LLM應(yīng)用于推理
9.2.2互操作性
9.2.3模型量化
9.2.4模型剪枝
9.2.5知識(shí)蒸餾
9.2.6大模型的成本預(yù)估
9.2.7模型推送到Hugging Face倉(cāng)庫(kù)
9.3本章小結(jié)
9.3.1歡迎向社區(qū)貢獻(xiàn)代碼
9.3.2繼續(xù)加油
第4部分附錄
附錄ALLM常見(jiàn)問(wèn)題解答
附錄BLLM術(shù)語(yǔ)表
附錄CLLM應(yīng)用架構(gòu)

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)