基于安全课程强化学习的自动驾驶决策方法、系统及介质

正文

推荐专利

申请号：CN202410754926

申请日期：2024-06-12

公开号：CN118597191B

公开日期：2025-09-09

类型：发明专利

摘要

本发明涉及一种基于安全课程强化学习的自动驾驶决策方法、系统及介质，其中方法包括以下步骤：感知周车和本车信息，作为环境信息；采用课程强化学习框架将自动驾驶任务划分为安全阶段和性能阶段，其中，安全阶段基于安全阶段的奖励函数进行安全智能体训练；在性能阶段部署安全智能体和性能智能体，固定安全阶段训练完成的安全智能体，基于性能阶段的奖励函数进行性能智能体训练，并使用切换函数实现安全智能体和性能智能体之间的切换；智能体与环境进行交互，根据损失函数更新网络参数，基于性能阶段网络输出的安全动作对车辆进行控制，实现自动驾驶安全决策。与现有技术相比，本发明具有训练高效、交互安全等优点。

技术关键词

自动驾驶决策方法阶段强化学习框架子系统车辆策略更新网络参数车道决策系统因子坐标转向角可读存储介质加速度计算机

系统为您推荐了相关专利信息

车辆故障识别方法、装置、设备及存储介质

车辆故障识别方法多特征信息车辆故障识别装置故障特征车辆运行数据

动作评估方法、装置、设备和存储介质

动作评估方法人体模型序列运动能力评估视频

一种协同推出的两阶段多跑道离港航班排序方法

航班排序方法跑道阶段鲸鱼算法连续时间马尔科夫链

一种基于用户分层和营销管理的私域流量运营方法及系统

阶段标签运营方法数据周期

一种水下机器人集群协同作业的高精度定位系统

高精度定位系统水下机器人定位子系统集群多源融合

基于安全课程强化学习的自动驾驶决策方法、系统及介质

站点导航

APP 下载