摘要
一种设备、数据结构和计算机实现的方法,为数字图像的区域查找匹配的语义名称以及为数字图像的区域查找匹配的语义名称而进行训练,其中用于训练的方法包括:提供数字图像和类别名称以及标识数字图像中的区域的指示符,根据类别名称提供候选名称的集合,确定数字图像的编码,根据数字图像的编码确定多尺度特征,确定候选名称的嵌入,根据用于候选名称的嵌入、多尺度特征和掩码的变换器解码器的输出嵌入,确定包括预测指示符和相应候选名称的预测类别的输出,根据多尺度特征确定逐像素特征,以及根据损失来训练变换器解码器,损失包括指示符和预测指示符之间的差异,预测指示符比其他预测指示符更好地复现指示符。
技术关键词
多尺度特征
解码器
变换器
数据字
预测类别
文本编码器
语义
像素
注意力
标识数字图像
计算机
存储器
处理器
线性
网络
指令
系统为您推荐了相关专利信息
烟田
识别方法
特征提取模块
特征金字塔网络
样本
开关运行状态
多时间尺度模型
监测方法
编码器
软阈值函数
光谱分析模型
色素
皮肤治疗
时间序列图像
多尺度特征提取