Python深度強化學習入門：強化學習和深度學習的搜索與控制

定　價：￥89.00

作　者：	（日）伊藤多一，今津義充，須藤廣大，仁平將人，川崎悠介等
出版社：	機械工業(yè)出版社
叢編項：
標　簽：	暫缺

購買這本書可以去

ISBN：	9787111700722	出版時間：	2022-04-01	包裝：
開本：	16開	頁數(shù)：	239	字數(shù)：

內容簡介

　　《Python深度強化學習入門：強化學習和深度學習的搜索與控制》共7章。第1章介紹了機器學習的分類、強化學習的學習機制以及深度強化學習的概念；第2章通過強化學習的基本概念、馬爾可夫決策過程和貝爾曼方程、貝爾曼方程的求解方法、無模型控制等介紹了強化學習的基本算法；第3章通過深度學習、卷積神經網(wǎng)絡（CNN）、循環(huán)神經網(wǎng)絡（RNN）介紹了強化學習中深度學習的特征提取方法；第4章通過行動價值函數(shù)的網(wǎng)絡表示、策略函數(shù)的網(wǎng)絡表示介紹了深度強化學習的實現(xiàn)；第5章通過策略梯度法的連續(xù)控制、學習算法和策略模型等，詳細介紹了深度強化學習在連續(xù)控制問題中的應用及具體實現(xiàn)；第6章通過巡回推銷員問題和魔方問題詳細介紹了深度強化學習在組合優(yōu)化中的應用及具體實現(xiàn)；第7章通過SeqGAN的文本生成和神經網(wǎng)絡架構的搜索詳細介紹了深度強化學習在時間序列數(shù)據(jù)生成的應用。在附錄中還給出了Colaboratory和Docker等深度強化學習開發(fā)環(huán)境的構建。

作者簡介

　　[日]伊藤多一，1995年在名古屋大學理學研究所完成博士課程，井獲得博士學位。后一直從事粒子物理學研究，直到2004年3月。同年，加入了一家專門從事合同數(shù)據(jù)分析的風險公司，井參與了多個數(shù)據(jù)分析項目。自2013年以來，他一直在BrainPad公司從事機器學習的廣告效果分析工作。自2016年以來，通過深度學習參與了圖像分析項目。今津義充，博士學位（理學），熟悉統(tǒng)計分析、模型構建以及基于數(shù)值分析的基本粒子和核物理研究。自2013年以來，領導了BrainPad公司的定量分析項目，例如需求預測和數(shù)學優(yōu)化等。近年來，一直從事利用深度學習技術的項目分析和應用研究。須藤廣大，在奈良科學技術學院主修自然語言處理，獲得碩士學位（信息工程）。后以新畢業(yè)生的身份加入BrainPad公司，井以機器學習工程師的身份從事與深度學習相關的項目分析和開發(fā)。仁平將人，碩士學位，在研究生院主修管理系統(tǒng)工程專業(yè)，于2018年加入BrainPad公司成為數(shù)據(jù)科學家。加入公司后，從事有關強化學習和自然語言處理的項目。川崎悠介，碩士學位，大學期間主修信息工程，并于2018年加入BrainPad公司。從事圖像識別和時間序列預測的相關項目研究。