本書共分為四篇,即深度強化學習、多智能體深度強化學習、多任務深度強化學習和深度強化學習的應用。由淺入深、通俗易懂,涵蓋經典算法和近幾年的前沿技術進展。特別是書中詳細介紹了每一種代表性算法的代碼原型實現(xiàn),旨在理論與實踐相結合,讓讀者學有所得、學有所用。 第一篇(包含第1~3章)主要講解深度強化學習基礎,側重于單智能體強化學習算法,相對簡單,有助于初級讀者理解,同時涵蓋了近幾年的經典算法和一些前沿的研究成果。 第二篇(包含第4~5章)主要側重于對多智能體深度強化學習的講解,從多智能體強化學習基本概念到相關算法的講解和分析,以多個極具代表性的算法為例帶領讀者逐步學習多智能體訓練及控制的理論與方法。同時,還介紹了多智能體強化學習領域一些前沿學術成果。 第三篇(包含第6~7章)擴展到多任務場景,稱為多任務深度強化學習。首先介紹了多任務強化學習的基本概念和相關基礎知識,隨后講解了部分經典的多任務深度強化學習算法。 第四篇(包含第8~11章)主要講解深度強化學習的實際應用,涉及游戲、機器人控制、計算機視覺和自然語言處理四大領域。通過領域應用中思想和方法的講解,培養(yǎng)讀者跨領域解決實際問題的能力,以幫助讀者熟練掌握和使用深度強化學習這一強大的方法來解決和優(yōu)化實際工程領域中的問題。