摘要
本发明适用于自动驾驶技术领域,提供了一种专用于自动驾驶的多模态指令遵循数据集构建方法,将整个端到端驾驶过程明确描述为元动作推理、行为解释生成以及控制信号预测的顺序组合,通过以意图认知为导向的算法规则自动整合对象级别问答注释,主要包括控制信号处理、元动作规则制定和行为解释文本生成三阶段构建流程,实现了对象级别问答数据的高层次、顺序化构建,为可解释端到端自动驾驶和多模态大语言模型领域提供了专用的多模态指令遵循数据集支撑。
技术关键词
数据集构建方法
速度估计
加速度
横摆角速度
文本
指令
自动驾驶技术
场景
信号处理
传感器
大语言模型
关系
多视角
高层次
接口
图像