摘要
本申请提供基于世界模型强化学习的端到端自动驾驶系统及控制方法,系统包括:多模态环境数据获取模块,用于获取多模态环境数据;状态隐变量编码网络,用于根据多模态环境数据生成当前时刻的状态隐变量;状态转移变量编码网络,用于根据当前时刻的状态隐变量和上一时刻的自动驾驶动作生成状态转移过程中的动力学隐变量;策略网络,采用预设的专家数据进行初始化,并采用KL散度损失和软更新机制对基于演员‑评论家架构的强化学习模型进行训练,用于根据当前时刻的状态隐变量和状态转移过程中的动力学隐变量决策生成自动驾驶动作。本申请基于世界模型结合模仿学习和强化学习,支持长期驾驶决策,并加速策略收敛,提升自动驾驶的安全性和稳定性。
技术关键词
多层感知器
变量
多模态环境
自动驾驶系统
强化学习模型
网络
激光雷达点云
驾驶控制方法
图像编码器
策略
点云特征
解码器
多视角
点云编码
数据获取模块
语义
系统为您推荐了相关专利信息
多尺度预测方法
网络结构
能耗
多模型
神经网络模型
配置优化方法
重合器
重合闸
灰狼优化算法
配电网络
码率
虚拟现实设备
位姿变化量
因子
视频传输方法