摘要
本发明属于自动驾驶技术领域,公开了一种基于分布式探索增强的自主驾驶决策近端策略优化方法。本发明设计了自动驾驶车辆的强化学习决策模块的分布式架构,通过并行化和分布式处理,多个智能体能够在不同环境中同时执行策略训练,实时共享策略更新和经验数据。此外,分布式架构允许方法在更大规模的数据集和复杂环境下运行,提升了自主驾驶决策的适应性和泛化能力。本发明还结合了随机网络探索RND模块,进一步增强探索的多样性和有效性,并完善强化学习决策模块所使用的近端策略优化算法。本发明通过结合分布式架构与RND模块,显著加速了训练过程,提升了探索效率,并全面提高了自动驾驶系统的决策质量,提高了自动驾驶决策的可靠性和效率。
技术关键词
策略优化方法
分布式架构
决策
网络
城市交通环境
车载摄像头
学习器
模块
图像
生成自动驾驶车辆
障碍物
城市交通场景
蒸馏方法
策略更新
算法
仿真平台
参数
速度