摘要
本申请提供了一种基于强化学习的智能驾驶决策系统及方法,基于所述驻车控制指令将决策动作映射为自动驻车的动作空间;确定动作空间中驻车操作的所有奖励因素,进而由各个奖励因素的即时奖励确定自动驻车后汽车的奖励轨迹;确定汽车在自动驻车时传感器噪声的状态空间,进而根据传感器噪声的状态空间和动作空间对驻车控制指令进行轨迹匹配,得到智能驾驶的抗干扰性;依据奖励轨迹和抗干扰性确定自动驻车后汽车的偏差轨迹,当偏差轨迹低于预设的驻车偏差阈值时,对汽车在自动驻车中的决策动作进行自适应约束调整。基于上述方案可实现汽车的自动驻车动作的约束调整,从而可提高汽车自动驻车的环境适应性。
技术关键词
传感器噪声
智能驾驶决策
轨迹
驻车控制方法
偏差
计算机设备
生成汽车
可读存储介质
存储计算机程序
控制单元
机制
存储器
监控模块
处理器