基于混合動(dòng)作的空戰(zhàn)分層強(qiáng)化學(xué)習(xí)決策算法
摘要: 智能空戰(zhàn)是世界主要軍事強(qiáng)國的研究熱點(diǎn)。為解決超視距空戰(zhàn)博弈機(jī)動(dòng)決策問題,提出了基于深度強(qiáng)化學(xué)習(xí)的超視距空戰(zhàn)分層決策算法。在該決策算法中,使用適合于超視距空戰(zhàn)的機(jī)動(dòng)動(dòng)作集,對飛機(jī)的航跡和姿態(tài)進(jìn)行控制。為了擴(kuò)大模型的動(dòng)作空間,提升模型的決策能力,將空戰(zhàn)的動(dòng)作空間進(jìn)行分層,建模為多維離散的動(dòng)作空間。針對空戰(zhàn)中稀疏獎(jiǎng)勵(lì)的問題,設(shè)計(jì)了一套綜合考慮位置優(yōu)勢、武器發(fā)射和武器威脅等要素的獎(jiǎng)勵(lì)函... (共18頁)
開通會(huì)員,享受整站包年服務(wù)