摘要
本发明提供一种基于多模态大模型的图像标注方法、装置及相关设备,涉及机器学习和多模态大模型技术领域,该方法包括:步骤S1、获取初始图像和目标对象的文本信息,目标对象为需要标注的第一类型的对象,文本信息用于描述目标对象;步骤S2、将初始图像和文本信息输入至预设多模态大模型中进行预测,得到第一标注区域和第一置信度,第一标注区域为预测得到的存在目标对象的区域,第一置信度为第一标注区域的置信度;步骤S3、生成第一标注图像,第一标注图像为基于第一标注区域对初始图像进行标注得到的图像;步骤S4、在第一置信度大于第一设定置信度阈值的情况下,将第一标注图像设为目标标注图像。本发明能减少图像标注时间,提升模型的训练效率。
技术关键词
多模态
图像标注方法
置信度阈值
对象
文本
标识
图像标注装置
坐标
标记
处理器
数据
可读存储介质
模块
存储器
电子设备
程序
系统为您推荐了相关专利信息
病害识别方法
多光谱特征
多模态特征
时序特征
图像
免疫组化切片
宫颈
误差
注意力机制
特征金字塔网络
术语
开源技术
缺陷数据处理方法
缺陷类别
关键词