基于MADDPG算法的匝道合流區(qū)多車協(xié)同控制
摘要: 為了保障匝道合流區(qū)的安全高效通行,提出了一種基于多智能體強(qiáng)化學(xué)習(xí)算法的多車協(xié)同控制方法。以提升系統(tǒng)計(jì)算效率為目標(biāo),設(shè)計(jì)了基于多智能體確定性策略梯度算法(MADDPG)的分布式訓(xùn)練框架;針對智能體模型難以應(yīng)對連續(xù)車流場景的問題,通過構(gòu)建相對靜止環(huán)境,改進(jìn)策略更新梯度,保障智能體面向連續(xù)車流環(huán)境的平穩(wěn)性;拆分匝道合流區(qū)場景為準(zhǔn)備區(qū)和匯入?yún)^(qū),分別依據(jù)兩區(qū)域控制目標(biāo)設(shè)計(jì)了狀態(tài)、動作空間... (共11頁)
開通會員,享受整站包年服務(wù)