當前位置:首頁 > 科技文檔 > 汽車工業(yè) > 正文

基于PPO算法的自動駕駛人機交互式強化學習方法

計算機應用研究 頁數(shù): 5 2024-05-17
摘要: 針對當前自動駕駛領域中深度強化學習(deep reinforcement learning, DRL)所面臨的高計算性能需求和收斂速度慢的問題,將變分自編碼器(variational autoencoder, VAE)和近端策略優(yōu)化算法(proximal policy optimization, PPO)相結合。通過采用VAE的特征編碼技術,將Carla模擬器獲取的語義圖像有效... (共5頁)

開通會員,享受整站包年服務