基于深度強(qiáng)化學(xué)習(xí)的雙星近距離追逃博弈控制方法
摘要: 為提高雙星近距離追逃博弈成功率和效率,提出了一種基于雙延遲深度確定性策略梯度的追逃博弈算法,采用互博弈的方式,優(yōu)化求解雙星博弈控制策略。首先建立了雙星追逃博弈環(huán)境和相對(duì)運(yùn)動(dòng)學(xué)模型,并利用雙人零和馬爾可夫博弈理論來(lái)描述追逃博弈問(wèn)題。其次為了改善空間追逃博弈環(huán)境中狀態(tài)維度多,搜索空間大導(dǎo)致的追逃任務(wù)成功率難以提高等問(wèn)題,設(shè)計(jì)了一種考慮追擊方向矢量的引導(dǎo)性獎(jiǎng)勵(lì)函數(shù)以及適用于雙星近距離... (共10頁(yè))
開通會(huì)員,享受整站包年服務(wù)