注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)計算機科學(xué)理論與基礎(chǔ)知識決策算法

決策算法

決策算法

定 價:¥149.00

作 者: [美]米凱爾·J. 科申德弗, [美]蒂姆·A. 惠勒, [美]凱爾·H. 雷
出版社: 機械工業(yè)出版社
叢編項:
標(biāo) 簽: 暫缺

ISBN: 9787111756583 出版時間: 2024-08-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  本書源于斯坦福大學(xué)的相關(guān)課程,主要介紹不確定狀態(tài)下的決策算法,涵蓋基本的數(shù)學(xué)問題和求解算法。本書共分為五個部分:首先解決在單個時間點上簡單決策的不確定性和目標(biāo)的推理問題;然后介紹隨機環(huán)境中的序列決策問題;接著討論模型不確定性,包括基于模型的方法和無模型的方法;之后討論狀態(tài)不確定性,包括jing確信念狀態(tài)規(guī)劃、離線信念狀態(tài)規(guī)劃、在線信念狀態(tài)規(guī)劃等;zui后討論多智能體系統(tǒng),涉及多智能體推理和協(xié)作智能體等。本書主要關(guān)注規(guī)劃和強化學(xué)習(xí),其中一些技術(shù)涉及監(jiān)督學(xué)習(xí)和優(yōu)化。書中的算法是用Julia編程語言實現(xiàn)的,并配有大量圖表、示例和練習(xí)題。本書要求讀者具備扎實的數(shù)學(xué)基礎(chǔ),適合計算機科學(xué)、數(shù)學(xué)、統(tǒng)計學(xué)、電氣工程、航空航天等領(lǐng)域的讀者閱讀。

作者簡介

  米凱爾·J. 科申德弗(Mykel J. Kochenderfer) 斯坦福大學(xué)航空航天系和計算機科學(xué)系副教授,智能系統(tǒng)實驗室(SISL)主任。曾任職于麻省理工學(xué)院林肯實驗室。目前主要研究用于設(shè)計魯棒決策系統(tǒng)的算法和分析方法。他擁有愛丁堡大學(xué)博士學(xué)位。蒂姆·A. 惠勒(Tim A. Wheeler) 軟件工程師,主要從事自動駕駛、控制和決策系統(tǒng)方面的研發(fā)工作。他擁有斯坦福大學(xué)博士學(xué)位。凱爾·H. 雷(Kyle H. Wray) Robust AI 公司工程總監(jiān),曾任硅谷創(chuàng)新聯(lián)盟實驗室首席研究員,目前主要從事自主機器人的研發(fā)工作,致力于設(shè)計和實現(xiàn)機器人決策系統(tǒng)。他擁有馬薩諸塞大學(xué)阿默斯特分校博士學(xué)位。

圖書目錄

目錄

Algorithms for Decision Making


譯者序
前言
致謝

第1章導(dǎo)論1
11決策1
12應(yīng)用2
121飛機防撞控制系統(tǒng)2
122自動駕駛控制系統(tǒng)2
123乳腺癌篩查2
124金融消費與投資組合配置3
125分布式森林火災(zāi)監(jiān)控系統(tǒng)3
126火星科學(xué)探測3
13方法3
131顯式編程4
132監(jiān)督式學(xué)習(xí)4
133優(yōu)化4
134規(guī)劃4
135強化學(xué)習(xí)4
14自動化決策過程的歷史4
141經(jīng)濟學(xué)5
142心理學(xué)6
143神經(jīng)科學(xué)6
144計算機科學(xué)6
145工程7
146數(shù)學(xué)7
147運籌學(xué)8
15社會影響8
16本書組織結(jié)構(gòu)9
161概率推理9
162序列問題9
163模型不確定性10
164狀態(tài)不確定性10
165多智能體系統(tǒng)10
第一部分概率推理
第2章表示12
21信念度和概率12
22概率分布12
221離散概率分布13
222連續(xù)概率分布13
23聯(lián)合分布16
231離散聯(lián)合分布16
232連續(xù)聯(lián)合分配19
24條件分布20
241離散條件模型21
242條件高斯模型21
243線性高斯模型22
244條件線性高斯模型22
245sigmoid模型22
246確定性變量22
25貝葉斯網(wǎng)絡(luò)23
26條件獨立性25
27本章小結(jié)26
28練習(xí)題27
第3章推理30
31貝葉斯網(wǎng)絡(luò)中的推理30
32樸素貝葉斯模型中的推理33
33“和積”變量消除35
34信念傳播36
35計算復(fù)雜度37
36直接抽樣37
37似然加權(quán)抽樣39
38吉布斯抽樣41
39高斯模型中的推理43
310本章小結(jié)44
311練習(xí)題45
第4章參數(shù)學(xué)習(xí)49
41最大似然參數(shù)學(xué)習(xí)49
411類別分布的最大似然估計50
412高斯分布的最大似然估計50
413貝葉斯網(wǎng)絡(luò)的最大似然估計51
42貝葉斯參數(shù)學(xué)習(xí)53
421二元分布的貝葉斯學(xué)習(xí)54
422類別分布的貝葉斯學(xué)習(xí)55
423貝葉斯網(wǎng)絡(luò)的貝葉斯學(xué)習(xí)56
43非參數(shù)學(xué)習(xí)57
44缺失數(shù)據(jù)的學(xué)習(xí)58
441數(shù)據(jù)插值58
442期望最大化60
45本章小結(jié)62
46練習(xí)題62
第5章結(jié)構(gòu)學(xué)習(xí)66
51貝葉斯網(wǎng)絡(luò)評分66
52有向圖搜索68
53馬爾可夫等價類71
54部分有向圖搜索72
55本章小結(jié)73
56練習(xí)題73
第6章簡單決策75
61理性偏好上的約束75
62效用函數(shù)76
63效用誘導(dǎo)76
64最大期望效用原則78
65決策網(wǎng)絡(luò)79
66信息價值81
67非理性82
68本章小結(jié)84
69練習(xí)題84
第二部分序列問題
第7章精確求解方法88
71馬爾可夫決策過程88
72策略評估90
73值函數(shù)策略92
74策略迭代93
75值迭代94
76異步值迭代96
77線性規(guī)劃方程98
78具有二次型獎勵的線性系統(tǒng)99
79本章小結(jié)102
710練習(xí)題102
第8章近似值函數(shù)108
81參數(shù)化表示108
82最近鄰109
83核平滑110
84線性插值112
85單純形插值114
86線性回歸116
87神經(jīng)網(wǎng)絡(luò)回歸119
88本章小結(jié)119
89練習(xí)題120
第9章在線規(guī)劃123
91滾動時域規(guī)劃123
92基于預(yù)演的前瞻算法124
93正向搜索125
94分支定界法126
95稀疏抽樣127
96蒙特卡羅樹搜索128
97啟發(fā)式搜索134
98標(biāo)記啟發(fā)式搜索136
99開環(huán)規(guī)劃139
991確定性模型預(yù)測控制140
992魯棒模型預(yù)測控制141
993多重預(yù)測模型預(yù)測控制142
910本章小結(jié)143
911練習(xí)題143
第10章策略搜索146
101近似策略評估146
102局部搜索147
<>

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號