一種融合噪聲網(wǎng)絡(luò)的裁剪雙深度Q網(wǎng)絡(luò)的船舶自主避碰決策算法
摘要: 針對海上船舶自主避碰決策中深度Q網(wǎng)絡(luò)(deep Q-network, DQN)算法的高估和收斂性差的問題,提出一種融合噪聲網(wǎng)絡(luò)的裁剪雙DQN(double DQN, DDQN)算法,記為NoisyNet-CDDQN算法。該算法采用裁剪雙Q值的方式減小DQN算法的高估問題,并通過引入噪聲網(wǎng)絡(luò)來增強(qiáng)算法的穩(wěn)定性以解決DQN算法收斂性差的問題。充分考慮船舶運(yùn)動(dòng)數(shù)學(xué)模型和船舶領(lǐng)域模型,... (共7頁)
開通會(huì)員,享受整站包年服務(wù)