基于多模态大模型的图像标注方法、装置及相关设备

AITNT
正文
推荐专利
基于多模态大模型的图像标注方法、装置及相关设备
申请号:CN202410946576
申请日期:2024-07-15
公开号:CN119006773A
公开日期:2024-11-22
类型:发明专利
摘要
本发明提供一种基于多模态大模型的图像标注方法、装置及相关设备,涉及机器学习和多模态大模型技术领域,该方法包括:步骤S1、获取初始图像和目标对象的文本信息,目标对象为需要标注的第一类型的对象,文本信息用于描述目标对象;步骤S2、将初始图像和文本信息输入至预设多模态大模型中进行预测,得到第一标注区域和第一置信度,第一标注区域为预测得到的存在目标对象的区域,第一置信度为第一标注区域的置信度;步骤S3、生成第一标注图像,第一标注图像为基于第一标注区域对初始图像进行标注得到的图像;步骤S4、在第一置信度大于第一设定置信度阈值的情况下,将第一标注图像设为目标标注图像。本发明能减少图像标注时间,提升模型的训练效率。
技术关键词
多模态 图像标注方法 置信度阈值 对象 文本 标识 图像标注装置 坐标 标记 处理器 数据 可读存储介质 模块 存储器 电子设备 程序
系统为您推荐了相关专利信息
1
基于视觉传感器的无人机目标跟踪方法及装置
对象 视觉传感器 跟踪方法 无人机 矩形
2
基于时序特征融合的作物早期病害识别方法及其系统
病害识别方法 多光谱特征 多模态特征 时序特征 图像
3
基于深度学习的宫颈免疫组化病变分级方法、系统及设备
免疫组化切片 宫颈 误差 注意力机制 特征金字塔网络
4
一种业务系统的开源缺陷数据处理方法和装置
术语 开源技术 缺陷数据处理方法 缺陷类别 关键词
5
一种游戏动画处理方法、装置、电子设备及存储介质
虚拟对象 动画 图像 插值算法 机器可读指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号