摘要
本申请实施例提供工业图像自动标注方法、装置、设备和存储介质,涉及人工智能技术领域。该方法获取待标注图像,将待标注图像输入视觉编码器进行特征编码得到图像特征,获取与工业图像相关的领域术语集合,根据初始噪声向量得到查询向量,根据图像特征得到键向量和值向量,将查询向量、键向量、值向量输入扩散模型,以领域术语集合作为约束条件进行多个时间步的迭代特征处理,得到文本潜向量,将文本潜向量和领域术语集合输入文本解码器进行解码,得到待标注图像对应的图像标注文本。在标注生成全过程都利用领域术语集合作为约束引导,确保标注文本始终围绕具体的工业场景展开,能够显著提高工业图像标注的准确性与规范性。
技术关键词
图像自动标注方法
术语
迭代特征
文本特征向量
样本
工业
噪声数据
视觉
文本编码器
解码器
注意力
词语
标注装置
人工智能技术
图像编码
系统为您推荐了相关专利信息
神经网络模型
质心侧偏角
横摆角速度
轮毂电机控制器
车辆控制方法
欺骗干扰检测方法
LSTM模型
滑窗技术
数字信号处理模块
全球卫星导航系统
价格涨跌预测
梯度提升模型
深度神经网络
AdaBoost分类器
推荐方法