基于李雅普诺夫函数的强化学习自动驾驶决策控制方法

正文

推荐专利

申请号：CN202511065939

申请日期：2025-07-31

公开号：CN120681173A

公开日期：2025-09-23

类型：发明专利

摘要

本发明公开了基于李雅普诺夫函数的强化学习自动驾驶决策控制方法，涉及自动驾驶汽车安全控制技术领域。本发明包括：接收自车以及周围环境车辆的行驶状态信息，其中自车行驶状态信息包括位置、速度、加速度、航向角，周围环境车辆的行驶状态信息包括环境车辆相对于自车的位置、速度、航向角以及车道线信息；构建基于强化学习的自动驾驶任务的决策控制模型，决策控制模型以自车以及周围环境车辆的行驶状态信息，以最优自动驾驶策略为输出。本发明通过理论证明的稳定性条件约束强化学习策略更新过程，在高速公路换道、紧急避障等动态场景中实现了安全性与决策效能的统一，针对采用强化学习训练自动驾驶的安全性和策略稳定性具有良好的应用前景。

技术关键词

李雅普诺夫函数行驶状态信息 SAC算法马尔可夫模型车道线信息车辆增广拉格朗日计算机可执行指令预定义阈值多层前馈神经网络策略更新方法差分算法决策控制系统策略优化方法强化学习框架强化学习策略

系统为您推荐了相关专利信息

一种基于T-S模糊近似的尾座式垂直起降无人机数据驱动模型预测控制方法及系统

垂直起降无人机数据驱动模型姿态控制系统矩阵滚动时域优化

一种用于岩石薄片图像的跨模态对齐方法

岩石薄片对齐方法 RANSAC算法轮廓滤波

一种盲水印嵌入和提取方法

图像块消息图像匹配盲水印嵌入方法编码器

一种低内存占用的SLAM位置识别方法及系统

位置识别方法关键帧机器人位置识别单元内存

一种多模态功率转换装置的协同优化控制方法、系统、设备及存储介质

协同优化控制方法功率转换装置孤岛运行模式脉宽调制驱动多模态

基于李雅普诺夫函数的强化学习自动驾驶决策控制方法

站点导航

APP 下载