摘要
本发明涉及一种基于强化学习的自动驾驶编队队形重组方法,包括:S1、采用图论描述编队与周围车辆的交互关系,预测编队与交互车辆的运动状态并进行碰撞检测,当碰撞风险值小于碰撞风险阈值时,转S4,否则转S2;S2、将编队决策过程建模为部分可观的马尔可夫决策过程,根据编队协同感知结果建立共享观察空间,采用强化学习算法输出编队行为决策结果;S3、基于编队行为决策结果,按照安全优先级依次对编队中车辆进行安全推演,更新编队行为决策结果;S4、根据可变车头时距计算理想间距,实时计算最优纵向控制量,进行编队跟车行驶;S5、循环执行S1~S4,直至编队完成自动驾驶任务。与现有技术相比,本发明安全鲁棒性高且编队整体通行效率高的优点。
技术关键词
车辆
决策
车头
加速度
强化学习算法
车道
风险
控制权
关系
场景
表达式
定义系统
特征数
笛卡尔
数学
车间
间距
鲁棒性
节点