注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)邊做邊學(xué)深度強(qiáng)化學(xué)習(xí):PyTorch程序設(shè)計(jì)實(shí)踐

邊做邊學(xué)深度強(qiáng)化學(xué)習(xí):PyTorch程序設(shè)計(jì)實(shí)踐

邊做邊學(xué)深度強(qiáng)化學(xué)習(xí):PyTorch程序設(shè)計(jì)實(shí)踐

定 價(jià):¥69.00

作 者: 小川雄太郎(Yutaro ogawa) 著,申富饒 于僡譯 譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 輕松上手IT技術(shù)日文譯叢
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787111650140 出版時(shí)間: 2020-04-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 228 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  Pytorch是基于python且具備強(qiáng)大GPU加速的張量和動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò),更是Python中優(yōu)先的深度學(xué)習(xí)框架,它使用強(qiáng)大的 GPU 能力,提供*大的靈活性和速度。本書(shū)指導(dǎo)讀者以Pytorch為工具在Python中學(xué)習(xí)深層強(qiáng)化學(xué)習(xí)(DQN)。主要內(nèi)容包括:強(qiáng)化學(xué)習(xí)概述及分類(lèi)、強(qiáng)化學(xué)習(xí)的算法和實(shí)施方法、在Pytorch中實(shí)施深度規(guī)劃與實(shí)現(xiàn)。、“實(shí)施深層強(qiáng)化學(xué)習(xí)DQN”、理解并實(shí)施新的深層強(qiáng)化學(xué)習(xí)方法(Double-DQN、Dueling Network、Prioritized Experience Replay、A3C、A2C)。

作者簡(jiǎn)介

暫缺《邊做邊學(xué)深度強(qiáng)化學(xué)習(xí):PyTorch程序設(shè)計(jì)實(shí)踐》作者簡(jiǎn)介

圖書(shū)目錄

譯者序
前言
第1章 強(qiáng)化學(xué)習(xí)概述1
1.1 機(jī)器學(xué)習(xí)的分類(lèi)(監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí))1
1.2 強(qiáng)化學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí)的歷史6
1.3 深度強(qiáng)化學(xué)習(xí)的應(yīng)用實(shí)例11
參考文獻(xiàn)14
第2章 在走迷宮任務(wù)中實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)16
2.1 Try Jupyter的使用方法16
2.2 迷宮和智能體的實(shí)現(xiàn)23
2.3 策略迭代法的實(shí)現(xiàn)31
2.4 價(jià)值迭代法的術(shù)語(yǔ)整理41
2.5 Sarsa的實(shí)現(xiàn)46
2.6 實(shí)現(xiàn)Q學(xué)習(xí)52
參考文獻(xiàn)57
第3章 在倒立擺任務(wù)中實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)59
3.1 在本地PC上準(zhǔn)備強(qiáng)化學(xué)習(xí)的實(shí)現(xiàn)和執(zhí)行環(huán)境59
3.2 倒立擺任務(wù)“CartPole”64
3.3 由多變量連續(xù)值表示的狀態(tài)的表格表示69
3.4 Q學(xué)習(xí)的實(shí)現(xiàn)72
參考文獻(xiàn)80
第4章 使用PyTorch實(shí)現(xiàn)深度學(xué)習(xí)81
4.1 神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的歷史81
4.2 深度學(xué)習(xí)的計(jì)算方法89
4.3 使用PyTorch實(shí)現(xiàn)MNIST手寫(xiě)數(shù)字分類(lèi)任務(wù)94
參考文獻(xiàn)107
第5章 深度強(qiáng)化學(xué)習(xí)DQN的實(shí)現(xiàn)108
5.1 深度強(qiáng)化學(xué)習(xí)DQN(深度Q網(wǎng)絡(luò))的說(shuō)明108
5.2 實(shí)現(xiàn)DQN的四個(gè)要點(diǎn)111
5.3 實(shí)現(xiàn)DQN(上) 113
5.4 實(shí)現(xiàn)DQN(下) 123
參考文獻(xiàn)127
第6章 實(shí)現(xiàn)深度強(qiáng)化學(xué)習(xí)的改進(jìn)版128
6.1 深度強(qiáng)化學(xué)習(xí)算法發(fā)展圖128
6.2 DDQN的實(shí)現(xiàn)132
6.3 Dueling Network的實(shí)現(xiàn)141
6.4 優(yōu)先經(jīng)驗(yàn)回放的實(shí)現(xiàn)145
6.5 A2C的實(shí)現(xiàn)157
參考文獻(xiàn)168
第7章 在AWS GPU環(huán)境中實(shí)現(xiàn)消磚塊游戲169
7.1 消磚塊游戲“Breakout”的描述169
7.2 準(zhǔn)備在AWS上使用GPU所需要的深度學(xué)習(xí)執(zhí)行環(huán)境174
7.3 學(xué)習(xí)Breakout的四個(gè)關(guān)鍵思想187
7.4 A2C的實(shí)現(xiàn)(上) 193
7.5 A2C的實(shí)現(xiàn)(下) 203
參考文獻(xiàn)212
后記214

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)