基于多模态大模型的图像标注方法、装置及相关设备

正文

推荐专利

申请号：CN202410946576

申请日期：2024-07-15

公开号：CN119006773A

公开日期：2024-11-22

类型：发明专利

摘要

本发明提供一种基于多模态大模型的图像标注方法、装置及相关设备，涉及机器学习和多模态大模型技术领域，该方法包括：步骤S1、获取初始图像和目标对象的文本信息，目标对象为需要标注的第一类型的对象，文本信息用于描述目标对象；步骤S2、将初始图像和文本信息输入至预设多模态大模型中进行预测，得到第一标注区域和第一置信度，第一标注区域为预测得到的存在目标对象的区域，第一置信度为第一标注区域的置信度；步骤S3、生成第一标注图像，第一标注图像为基于第一标注区域对初始图像进行标注得到的图像；步骤S4、在第一置信度大于第一设定置信度阈值的情况下，将第一标注图像设为目标标注图像。本发明能减少图像标注时间，提升模型的训练效率。

技术关键词

多模态图像标注方法置信度阈值对象文本标识图像标注装置坐标标记处理器数据可读存储介质模块存储器电子设备程序

系统为您推荐了相关专利信息

基于视觉传感器的无人机目标跟踪方法及装置

对象视觉传感器跟踪方法无人机矩形

基于时序特征融合的作物早期病害识别方法及其系统

病害识别方法多光谱特征多模态特征时序特征图像

基于深度学习的宫颈免疫组化病变分级方法、系统及设备

免疫组化切片宫颈误差注意力机制特征金字塔网络

一种业务系统的开源缺陷数据处理方法和装置

术语开源技术缺陷数据处理方法缺陷类别关键词

一种游戏动画处理方法、装置、电子设备及存储介质

虚拟对象动画图像插值算法机器可读指令

基于多模态大模型的图像标注方法、装置及相关设备

站点导航

APP 下载