基于世界模型强化学习的端到端自动驾驶系统及控制方法

正文

推荐专利

申请号：CN202511145692

申请日期：2025-08-15

公开号：CN120972680A

公开日期：2025-11-18

类型：发明专利

摘要

本申请提供基于世界模型强化学习的端到端自动驾驶系统及控制方法，系统包括：多模态环境数据获取模块，用于获取多模态环境数据；状态隐变量编码网络，用于根据多模态环境数据生成当前时刻的状态隐变量；状态转移变量编码网络，用于根据当前时刻的状态隐变量和上一时刻的自动驾驶动作生成状态转移过程中的动力学隐变量；策略网络，采用预设的专家数据进行初始化，并采用KL散度损失和软更新机制对基于演员‑评论家架构的强化学习模型进行训练，用于根据当前时刻的状态隐变量和状态转移过程中的动力学隐变量决策生成自动驾驶动作。本申请基于世界模型结合模仿学习和强化学习，支持长期驾驶决策，并加速策略收敛，提升自动驾驶的安全性和稳定性。

技术关键词

多层感知器变量多模态环境自动驾驶系统强化学习模型网络激光雷达点云驾驶控制方法图像编码器策略点云特征解码器多视角点云编码数据获取模块语义

系统为您推荐了相关专利信息

一种室内热舒适性及能耗多尺度预测方法

多尺度预测方法网络结构能耗多模型神经网络模型

一种基于灰狼优化器的中压配电网重合闸配置优化方法

配置优化方法重合器重合闸灰狼优化算法配电网络

视频传输方法、电子设备及虚拟现实设备

码率虚拟现实设备位姿变化量因子视频传输方法

一种三维珠宝模型中的珍珠渲染方法及系统

珠宝模型渲染方法渲染系统光照网格

一种路径优化方法、装置和设备

位置更新路径优化方法社会阶段模块

基于世界模型强化学习的端到端自动驾驶系统及控制方法

站点导航

APP 下载