摘要
本申请公开了一种自动驾驶道路图像标注方法、设备及介质,涉及计算机视觉领域,方法包括:采集车辆自动驾驶过程中的道路场景图像,提取道路场景图像的多尺度视觉特征,通过预标注训练集判断是否存在已知类别物体;若不存在,则识别多尺度视觉特征的密集区域,生成为新物体候选区域,生成对应的候选文本描述;基于候选文本描述,在语义文本库中进行匹配,确定相似度最高的相似语义文本;将相似语义文本和多尺度视觉特征进行融合,生成视觉特征图,确定初始物体标注框以及对应的视觉置信度得分;对初始物体标注框进行筛选,输出目标物体的标注框。将视觉特征与文本语义融合,显著提升了对动态道路场景中新兴物体的适配能力。
技术关键词
道路场景图像
图像标注方法
视觉特征
语义
物体
多尺度
金字塔
文本特征向量
非易失性计算机存储介质
计算机可执行指令
训练集
预测类别
带上下文
标注设备
图像块
计算机视觉
处理器通信
系统为您推荐了相关专利信息
智能整合系统
智能整合方法
区块链存证技术
BERT模型
数据处理模块
历史轨迹数据
船舶
动态预测方法
多模态
移动轨迹数据