摘要
本发明提供一种无人驾驶安全控制方法,涉及无人驾驶技术领域。该方法首先基于马尔科夫决策过程构建无人驾驶系统控制模型;并采用近端策略优化算法训练深度强化学习智能体;再评估车辆行为的稳定性,在训练深度强化学习智能体的总体目标函数中增加安全约束惩罚函数,以对智能体的行为进行约束;最后通过“专家模型”来指导策略网络学习提高策略网络的学习效率和策略性能。该方法设计强调实时性和适应性,以满足不同应用场景下对速度和准确性的需求,同时通过持续学习优化策略,以适应环境中的不断变化。
技术关键词
安全控制方法
深度强化学习
车辆
车道
网络架构
策略更新
连续动作空间
决策
无人驾驶系统
无人驾驶技术
系统控制
网络结构
惩罚策略
速度
代表
参数
估计误差
算法
系统为您推荐了相关专利信息
横摆角速度
布谷鸟算法
线控转向系统
方向盘
车辆纵向速度
场景感知方法
室内移动机器人
语义分割网络
三维点云数据
场景三维点云
冰壶机器人
冰面
阶段
分层策略
深度强化学习方法