基于深度強化學(xué)習(xí)CLPER-DDPG的車輛縱向速度規(guī)劃
摘要: 為了解決車輛縱向速度規(guī)劃任務(wù)中規(guī)劃器不易收斂以及在多場景之間切換時穩(wěn)定性差的問題,基于多層感知機設(shè)計了車輛縱向速度規(guī)劃器,構(gòu)建了結(jié)合優(yōu)先經(jīng)驗回放機制和課程學(xué)習(xí)機制的深度確定性策略梯度算法。該文設(shè)計了仿真場景進行模型的訓(xùn)練和測試,并對深度確定性策略梯度(DDPG)、結(jié)合優(yōu)先經(jīng)驗回放機制的深度確定性策略梯度(PER-DDPG)、結(jié)合優(yōu)先經(jīng)驗回放機制和課程學(xué)習(xí)機制的深度確定性策略梯度... (共9頁)
開通會員,享受整站包年服務(wù)