摘要
本公开涉及数据处理技术领域,公开了一种多模态通用感知模型训练、标注方法及装置、电子设备,该方法包括:确定多个样本图像,并分别对每个样本图像进行标注,确定每个样本图像对应的多个初始区域级图文数据标注结果;对每个样本图像对应的多个初始区域级图文数据标注结果进行修正,确定每个样本图像对应的多个修正后的标注结果;基于每个样本图像对应的多个修正后的标注结果,对多模态通用感知模型进行训练,得到训练好的多模态通用感知模型,用于对目标图像进行标注,确定目标图像对应的多个区域级图文数据标注结果。本公开实施例可以简化区域级图文标注过程,实现通过多模态通用感知模型对目标图像进行自动标注,降低标注成本,提高标注效率。
技术关键词
样本
图文
对象
多模态
标注方法
感知模型训练方法
非易失性计算机可读存储介质
特征提取模型
计算机程序指令
语义
位置识别
模型训练装置
模型训练模块
电子设备
图像获取模块
标注装置
数据处理技术
处理器