當前位置:首頁 > 科技文檔 > 數(shù)學 > 正文

基于強化學習的兩時間尺度系統(tǒng)最優(yōu)跟蹤控制

儀表技術與傳感器 頁數(shù): 7 2024-09-25
摘要: 針對兩時間尺度系統(tǒng)的最優(yōu)跟蹤控制問題,提出了一種基于奇異攝動理論與強化學習技術的方法。首先,通過研究奇異攝動理論,將系統(tǒng)分解為快和慢2個子系統(tǒng),解決了系統(tǒng)存在的奇異攝動參數(shù)問題。其次,將系統(tǒng)的跟蹤問題分解為慢子系統(tǒng)的線性二次型跟蹤(linear quadratic tracking, LQT)問題和快子系統(tǒng)的線性二次型調(diào)節(jié)(linear quadratic regulator,... (共7頁)

開通會員,享受整站包年服務