注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)工業(yè)技術(shù)機(jī)械、儀表工業(yè)基于增強(qiáng)學(xué)習(xí)的制造系統(tǒng)調(diào)度

基于增強(qiáng)學(xué)習(xí)的制造系統(tǒng)調(diào)度

基于增強(qiáng)學(xué)習(xí)的制造系統(tǒng)調(diào)度

定 價(jià):¥88.00

作 者: 張智聰,鄭力 著
出版社: 科學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 工業(yè)技術(shù) 一般工業(yè)技術(shù)

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787030492890 出版時(shí)間: 2016-06-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 219 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  增強(qiáng)學(xué)習(xí)是人工智能領(lǐng)域一種應(yīng)用越來(lái)越廣泛的機(jī)器學(xué)習(xí)算法?!痘谠鰪?qiáng)學(xué)習(xí)的制造系統(tǒng)調(diào)度》對(duì)增強(qiáng)學(xué)習(xí)的基本原理、主要經(jīng)典算法及其在制造系統(tǒng)調(diào)度領(lǐng)域若干問(wèn)題的應(yīng)用進(jìn)行闡述。主要內(nèi)容包括:Sarsa(λ,k)增強(qiáng)學(xué)習(xí)算法等增強(qiáng)學(xué)習(xí)算法的介紹及相關(guān)理論證明;增強(qiáng)學(xué)習(xí)架構(gòu)及面向生產(chǎn)調(diào)度問(wèn)題的增強(qiáng)學(xué)習(xí)模型構(gòu)建方式;流水車(chē)間調(diào)度問(wèn)題、平行機(jī)調(diào)度問(wèn)題、半導(dǎo)體測(cè)試調(diào)度問(wèn)題等制造系統(tǒng)調(diào)度問(wèn)題與自組織型排隊(duì)網(wǎng)絡(luò)調(diào)度問(wèn)題的增強(qiáng)學(xué)習(xí)模型及解決方案;增強(qiáng)學(xué)習(xí)在以上調(diào)度問(wèn)題應(yīng)用的實(shí)驗(yàn)結(jié)果及相關(guān)分析等?!痘谠鰪?qiáng)學(xué)習(xí)的制造系統(tǒng)調(diào)度》適合管理科學(xué)與工程、工業(yè)工程等專(zhuān)業(yè)的研究生和本科生使用,也可供從事制造系統(tǒng)分析與優(yōu)化、智能調(diào)度等領(lǐng)域工作的研究人員和工程技術(shù)人員參考。

作者簡(jiǎn)介

  張智聰,1980年生,廣東東莞人,2007年于清華大學(xué)獲博士學(xué)位,現(xiàn)任東莞理工學(xué)院教授、中國(guó)機(jī)械工程學(xué)會(huì)生產(chǎn)工程分會(huì)生產(chǎn)系統(tǒng)專(zhuān)業(yè)委員會(huì)常委。主要研究領(lǐng)域是制造系統(tǒng)優(yōu)化、排隊(duì)網(wǎng)絡(luò),增強(qiáng)學(xué)習(xí)。主持國(guó)家自然科學(xué)基金、教育部人文社會(huì)科學(xué)研究項(xiàng)目、廣東省自然科學(xué)基金,廣東省科技計(jì)劃、廣東省高等學(xué)校優(yōu)秀青年教師培養(yǎng)計(jì)劃、廣東省教育廳重點(diǎn)平臺(tái)及科研項(xiàng)目等多個(gè)科研項(xiàng)目。在國(guó)內(nèi)外期刊發(fā)表論文20余篇,獲得4項(xiàng)專(zhuān)利授權(quán)和1項(xiàng)軟件著作權(quán)。鄭力,1991年于清華大學(xué)獲博士學(xué)位,現(xiàn)任清華大學(xué)工業(yè)工程系教授、博士生導(dǎo)師、教育部長(zhǎng)江學(xué)者特聘教授,機(jī)械工程學(xué)會(huì)工業(yè)工程分會(huì)副主任委員,生產(chǎn)工程分會(huì)的常務(wù)理事、國(guó)際工業(yè)工程學(xué)會(huì)中國(guó)部首任主任,多個(gè)國(guó)際學(xué)術(shù)期刊的編委。主要研究領(lǐng)域是生產(chǎn)系統(tǒng)分析與管理、企業(yè)信息化。發(fā)表論文200余篇,出版專(zhuān)著和教材5本,曾獲得國(guó)家科技進(jìn)步獎(jiǎng)、高等教育國(guó)家教學(xué)成果一等獎(jiǎng)、國(guó)家發(fā)明獎(jiǎng)、教育部?jī)?yōu)秀青年教師獎(jiǎng)和北京市五一勞動(dòng)獎(jiǎng)?wù)?,享受?chē)?guó)務(wù)院特殊津貼。

圖書(shū)目錄

前言
第1章 緒論
1.1 增強(qiáng)學(xué)習(xí)基本原理
1.1.1 馬爾可夫決策過(guò)程
1.1.2 增強(qiáng)學(xué)習(xí)系統(tǒng)
1.1.3 增強(qiáng)學(xué)習(xí)算法的分類(lèi)與發(fā)展概述
1.2 增強(qiáng)學(xué)習(xí)算法應(yīng)用引例——最短路問(wèn)題
1.3 增強(qiáng)學(xué)習(xí)算法在調(diào)度領(lǐng)域的應(yīng)用研究
1.4 本書(shū)組織結(jié)構(gòu)
第2章 增強(qiáng)學(xué)習(xí)算法
2.1 經(jīng)典的增強(qiáng)學(xué)習(xí)算法
2.1.1 TD/TD(λ)學(xué)習(xí)算法
2.1.2 Q學(xué)習(xí)
2.1.3 Sarsa算法
2.1.4 R學(xué)習(xí)
2.2 Sarsa(λ,k)算法
2.2.1 Sarsa(λ,k)算法的基本原理
2.2.2 前視與后視Sarsa(λ,k)算法
2.2.3 Sarsa(λ,k)算法的性質(zhì)
2.3 SMDP型Sarsa(λ,k)算法
2.4 多維行為的增強(qiáng)學(xué)習(xí)算法
2.5 一種自適應(yīng)步長(zhǎng)的增強(qiáng)學(xué)習(xí)算法
第3章 流水車(chē)間調(diào)度問(wèn)題
3.1 問(wèn)題描述
3.2 流水車(chē)間調(diào)度問(wèn)題的增強(qiáng)學(xué)習(xí)模型
3.2.1 系統(tǒng)狀態(tài)表示
3.2.2 行為
3.2.3 報(bào)酬函數(shù)
3.3 結(jié)合線(xiàn)性函數(shù)泛化器的TD(λ)算法及實(shí)驗(yàn)結(jié)果
3.3.1 結(jié)合線(xiàn)性函數(shù)泛化器的TD(λ)算法
3.3.2 實(shí)驗(yàn)結(jié)果
第4章 平行機(jī)調(diào)度問(wèn)題
4.1 最小化加權(quán)平均流程時(shí)間的離線(xiàn)平行機(jī)調(diào)度
4.1.1 問(wèn)題描述
4.1.2 增強(qiáng)學(xué)習(xí)模型
4.1.3 實(shí)驗(yàn)結(jié)果
4.2 最小化加權(quán)平均誤工時(shí)間的離線(xiàn)平行機(jī)調(diào)度
4.2.1 問(wèn)題描述
4.2.2 增強(qiáng)學(xué)習(xí)建模
4.2.3 實(shí)驗(yàn)結(jié)果
4.3 最小化加權(quán)平均流程時(shí)間的在線(xiàn)平行機(jī)調(diào)度
4.3.1 問(wèn)題描述
4.3.2 增強(qiáng)學(xué)習(xí)模型
4.3.3 實(shí)驗(yàn)結(jié)果
4.4 最小化加權(quán)平均誤工時(shí)間的在線(xiàn)平行機(jī)調(diào)度
4.4.1 問(wèn)題描述
4.4.2 增強(qiáng)學(xué)習(xí)模型
4.4.3 求解變速機(jī)調(diào)度問(wèn)題的R學(xué)習(xí)
4.4.4 實(shí)驗(yàn)結(jié)果
第5章 半導(dǎo)體測(cè)試調(diào)度問(wèn)題
5.1 半導(dǎo)體測(cè)試調(diào)度問(wèn)題描述
5.2 關(guān)于半導(dǎo)體測(cè)試調(diào)度的研究
5.2.1 附加資源充足的半導(dǎo)體測(cè)試調(diào)度
5.2.2 附加資源受限的半導(dǎo)體測(cè)試調(diào)度
5.2.3 和半導(dǎo)體測(cè)試調(diào)度相關(guān)的調(diào)度問(wèn)題
5.2.4 小結(jié)
5.3 整數(shù)規(guī)劃模型
5.3.1 符號(hào)定義
5.3.2 決策變量
5.3.3 目標(biāo)函數(shù)和約束
5.3.4 問(wèn)題性質(zhì)分析
5.4 半導(dǎo)體測(cè)試調(diào)度問(wèn)題的增強(qiáng)學(xué)習(xí)模型
5.4.1 狀態(tài)變量及狀態(tài)轉(zhuǎn)移機(jī)制
5.4.2 行為
5.4.3 報(bào)酬函數(shù)
5.5 結(jié)合函數(shù)泛化器的Sarsa(λ,k)算法
5.5.1 徑向基神經(jīng)網(wǎng)絡(luò)函數(shù)泛化器
5.5.2 神經(jīng)網(wǎng)絡(luò)的構(gòu)造
5.5.3 函數(shù)泛化器的權(quán)重更新法則
5.5.4 結(jié)合徑向基神經(jīng)網(wǎng)絡(luò)函數(shù)泛化器的Sarsa(λ,k)算法
5.6 演示算例
5.7 參數(shù)設(shè)置與函數(shù)泛化器性能分析
5.7.1 行為選擇
5.7.2 參數(shù)設(shè)置
5.7.3 函數(shù)泛化器性能分析
5.8 半導(dǎo)體測(cè)試調(diào)度實(shí)驗(yàn)結(jié)果與分析
5.8.1 與工業(yè)方法及各行為策略對(duì)比
5.8.2 與其他增強(qiáng)學(xué)習(xí)算法對(duì)比
5.8.3 與能力約束調(diào)度方法對(duì)比
5.9 討論
5.10 可重構(gòu)制造系統(tǒng)調(diào)度
5.10.1 具有可重構(gòu)特性的調(diào)度系統(tǒng)機(jī)制
5.10.2 增強(qiáng)學(xué)習(xí)模型架構(gòu)
第6章 排隊(duì)網(wǎng)絡(luò)控制問(wèn)題
6.1 多服務(wù)臺(tái)排隊(duì)系統(tǒng)控制的半馬爾可夫決策模型
6.1.1 問(wèn)題描述
6.1.2 半馬爾可夫決策模型建模
6.1.3 排隊(duì)控制系統(tǒng)的性質(zhì)
6.1.4 數(shù)值例子
6.2 自組織型排隊(duì)網(wǎng)絡(luò)控制問(wèn)題
6.2.1 自組織型排隊(duì)網(wǎng)絡(luò)控制問(wèn)題描述
6.2.2 自組織型排隊(duì)網(wǎng)絡(luò)控制問(wèn)題的增強(qiáng)學(xué)習(xí)模型
6.2.3 解決自組織型排隊(duì)網(wǎng)絡(luò)控制問(wèn)題的增強(qiáng)學(xué)習(xí)算法
第7章 結(jié)束語(yǔ)
參考文獻(xiàn)
其他參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)