摘要
本申请提出一种基于双模博弈与深度逆强化学习的交互感知自动驾驶方法,属于自动驾驶领域。采用Stackelberg博弈与贝叶斯Stackelberg博弈以综合判断V2V是否可用,实施领导者先宣布变道意图,跟随者根据自身驾驶风格响应领导者的决策手段,再通过深度逆强化学习规划类人轨迹,达到更贴合实际、提升安全性和效率的使用目的。基于信息的完整性将决策分为Stackelberg博弈与贝叶斯Stackelberg博弈两种模式;若所有相关车辆均通过V2V提供交互意图,则采用Stackelberg博弈;若存在部分车辆意图不透明,则需通过传感器和概率模型推测对手行为,触发贝叶斯Stackelberg博弈。
技术关键词
深度逆强化学习
自动驾驶方法
轨迹
多项式
加速度
车道
规划
决策
意图
策略
数据一致性校验
驾驶员反应时间
自主车辆
场景
交通
多传感器融合
人类驾驶员
制动减速度
系统为您推荐了相关专利信息
预警系统
预警机制
密度
视频监控设备
数据采集层
精确定位方法
北斗卫星定位
中央控制单元
无线通信模块
车载终端
智能监测方法
三维结构
深度学习算法
加速度
视频采集终端