基于D3QN的火力方案優(yōu)選方法
摘要: 針對在多類彈藥協(xié)同攻擊地面工事類目標(biāo)任務(wù)中火力方案優(yōu)選效率低的問題,提出一種基于雙層決斗DQN(duelingdoubledeepQnetwork,D3QN)的火力方案優(yōu)選方法。該方法將打擊過程建模為馬爾科夫決策過程(Markovdecisionprocesses,MDP),設(shè)計其狀態(tài)空間和動作空間,設(shè)計綜合獎勵函數(shù)激勵火力方案生成策略優(yōu)化,使智能體通過強化學(xué)習(xí)框架對策略進行自... (共9頁)
開通會員,享受整站包年服務(wù)