摘要
本公开提供了一种端到端自动驾驶方法、自动驾驶模型训练方法及装置,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于自动驾驶等场景。具体实现方案为:从自动驾驶车辆采集的视觉数据中提取出第一视觉特征;对第一视觉特征进行剪枝,得到关键视觉特征;将关键视觉特征对齐到语言空间,得到关键视觉特征对应的第二视觉特征;基于语言模型处理第二视觉特征和导航指令,得到自动驾驶车辆的未来轨迹;基于未来轨迹生成自动驾驶车辆的驾驶指令。
技术关键词
视觉特征
驾驶模型训练方法
核心
注意力
自动驾驶方法
轨迹
编码特征
指令
辅助训练器
变换器
生成自动驾驶车辆
样本
松弛方法
自动驾驶装置
文本
融合特征
数据
模型训练装置