摘要
本申请涉及一种用于计算基础平台的基于世界模型理解的端到端控制方法,其中,包括:获取当前车辆的多视角视频数据集、候选输入指令、地图信息和文本信息;根据多视角视频数据集生成多视角图像,并基于多视角图像、候选输入指令、地图信息和文本信息,根据预设的奖励函数,生成最优控制指令;根据多视角图像、地图信息、文本信息和最优控制指令生成多模态信息统一接口,并基于多模态信息统一接口对当前车辆进行端到端控制。由此,通过构建一个端到端的控制模型,直接从感知数据生成车辆控制信号,解决了现有技术难实现的由感知到控制的完全端到端自动驾驶、控制代价高和行驶风格不可定制等问题,提升了自动驾驶的效率。
技术关键词
多视角
多模态信息
原始图像数据
文本
指令
图像建模方法
视频
车辆
接口
平台
基础
处理器
编码器
随机噪声
地图
可读存储介质
系统为您推荐了相关专利信息
冷压缩机
仿真模型
生成可执行文件
仿真环境
控制系统
内容提取方法
大语言模型
关系型数据库
多模态
批量数据处理