當(dāng)前位置:首頁 > 科技文檔 > 自動化技術(shù) > 正文

事件觸發(fā)式多智能體分層安全強化學(xué)習(xí)運動規(guī)劃

控制與決策 頁數(shù): 8 2024-06-06
摘要: 針對深度強化學(xué)習(xí)序貫決策過程中面臨的動作安全性問題,研究一種事件觸發(fā)式多智能體分層安全強化學(xué)習(xí)運動規(guī)劃方法.首先,基于受限馬爾可夫決策模型,構(gòu)建一種具備安全約束的多智能體深度確定性策略梯度框架,該框架針對不同狀態(tài)空間,以事件觸發(fā)的方式實現(xiàn)運動策略的分層學(xué)習(xí);然后,通過引入李雅普諾夫評價網(wǎng)絡(luò),建立帶有條件約束的目標(biāo)動作選擇機制,并利用拉格朗日乘子法,解決多目標(biāo)約束求解困難的問題,... (共8頁)

開通會員,享受整站包年服務(wù)
說明: 本文檔由創(chuàng)作者上傳發(fā)布,版權(quán)歸屬創(chuàng)作者。若內(nèi)容存在侵權(quán),請點擊申訴舉報