摘要
本发明提供无标记视频辅助的强化学习端到端自动驾驶系统和方法,包括:隐动作模型学习模块,基于源域中无标记的视觉图像和目标域的视觉图像,学习所述视觉图像的隐动作信息;层级世界模型学习模块,以源域的所述视觉图像、目标域的视觉图像、执行动作、奖励信息,以及所述隐动作信息为输入,获得训练好的层级世界模型;行为策略模型学习模块,基于训练好的层级世界模型获得的当前时刻的隐动作信息及状态信息,学习车辆当前时刻的执行动作。本发明利用未标注动作标签的视频数据作为辅助信息,学习视频数据中隐藏的物理规律和行为模式,为智能体提供先验知识,以弥补离线数据分布不均的不足。
技术关键词
自动驾驶系统
视觉
层级
编码器模块
视频
标记
策略
自动驾驶方法
图像重建
动作特征
车辆
编码特征
信息模块
数据分布
处理器
变量
存储器
系统为您推荐了相关专利信息
文本特征向量
卷积神经网络提取
引入注意力机制
预训练语言模型
视觉特征提取
室内移动服务机器人
仿真环境
指令
数据
图像编码器
汽车轮毂螺母
拆卸方法
工业控制计算机
照片
移动滑轨机构
自动监测方法
多模态数据融合
加权特征
动态权重分配
音频特征数据
监测方法
特征提取算法
视觉
非暂态计算机可读存储介质
数据