基于強化學習的兩時間尺度系統(tǒng)最優(yōu)跟蹤控制
摘要: 針對兩時間尺度系統(tǒng)的最優(yōu)跟蹤控制問題,提出了一種基于奇異攝動理論與強化學習技術的方法。首先,通過研究奇異攝動理論,將系統(tǒng)分解為快和慢2個子系統(tǒng),解決了系統(tǒng)存在的奇異攝動參數(shù)問題。其次,將系統(tǒng)的跟蹤問題分解為慢子系統(tǒng)的線性二次型跟蹤(linear quadratic tracking, LQT)問題和快子系統(tǒng)的線性二次型調(diào)節(jié)(linear quadratic regulator,... (共7頁)
開通會員,享受整站包年服務