摘要
本发明公开了一种基于隐式时间刻度强化学习的自动驾驶车辆决策方法,包括基于隐式时间刻度的决策模型、改进的强化学习探索方法、基于规则和学习的移动方法以及智能环境车辆模型;基于隐式时间刻度的决策模型将时间刻度信息以隐式的方法导入状态价值表,从而提高决策行为的延续性;改进的强化学习探索方法使用基于预设策略的探索方法、基于反向传播的值表更新方法和基于动量法的局部最优点突破对强化学习的探索效率进行了改进;基于规则和学习的移动方法和智能环境车辆模型可以建立仿真环境对本发明决策的有效性和延续性进行验证。本发明将时间信息隐于状态价值表中,提高了车辆的决策延续性与安全性。
技术关键词
决策方法
刻度
更新方法
延续性
车道
车辆模型
ABS机制
构建决策模型
风格
仿真环境
移动单元
超车意图
贪心策略
习惯
有效性
阶段
系统为您推荐了相关专利信息
增程器控制方法
事件检测模型
车辆
高级驾驶辅助系统
预测等待时间
人力资源规划
决策
变邻域搜索算法
强化学习算法
层级
磁感应传感器
霍尔传感器芯片
柔性联轴器
磁铁
凸台
电网模型数据
下装方法
计算机程序产品
更新方法
指令