摘要
本发明公开了图像自动标注方法、系统、电子设备及存储介质,包括:基于特征融合机制和注意力机制构建多模态大模型;获取预设的标注数据集,将标注数据集输入到多模态大模型,得到训练好的图像标注模型;获取目标图像和对应的初始描述语句,将初始描述语句拆解为多个最小化问句,并将目标图像和最小化问句输入到图像标注模型,得到各最小化问句对应的目标标注结果;根据目标标注结果对最小化问句进行筛选和内容重组,得到目标图像的目标描述语句。本发明提高了图像自动标注的全面性和准确性,可广泛应用于图像处理技术领域。
技术关键词
图像自动标注方法
多模态
语句
空间金字塔
通道注意力机制
电子设备
融合特征
模型训练模块
处理器
标注系统
多尺度
图像处理技术
数据总线
存储器
程序
系统为您推荐了相关专利信息
数据脱敏方法
字段
语句
非暂态计算机可读存储介质
数据脱敏装置
品质检测方法
多模态深度学习
大数据
空间特征提取
评估指标量化模型
应急响应系统
风险
滑动窗口机制
指令
化学品存储设备
品质评价方法
葡萄干
多任务深度学习模型
品质评价模型
表面图像数据