摘要
本发明涉及车辆行为决策的技术领域,特别是涉及一种基于改进DDPG算法的车辆跟驰行为决策方法,包括:根据原始自然数据集,筛选出符合条件的跟车事件数据,筛选出的跟车事件、选取数据集中合适的驾驶行为数据特征、建立基于改进DDPG算法的车辆跟驰模型、设置状态空间、设置动作空间、奖励函数R综合考虑了三方面因素、训练和策略收敛或达到预设的训练轮数时,终止训练过程;其通过双重经验回放池帮助存储和重用历史经验数据,引入两个独立回放池和进行延迟的间隔随机采样进行数据获取拟提高决策的效率,奖励函数综合考虑了三方面,安全性、效率性和舒适性,使得智能体能考虑到当前时间步的综合表现,从而达到精度较高的车辆跟驰行为决策的。
技术关键词
车辆
决策方法
网络
加速度
参数
变量
样本
算法
数据
车头
强化学习环境
皮尔逊相关系数
轨迹
定义
小轿车
控制策略
批量