摘要
本申请实施例提供一种多任务视觉处理及其模型的训练方法、电子设备、存储介质、程序产品,涉及视觉处理技术领域,该方法包括:生成目标图像的多尺度特征图,并对多尺度特征图执行自注意编码处理,得到多尺度特征序列;基于多尺度特征序列和多任务视觉处理模型的拼接任务查询向量执行多次解码处理;解码处理包括:对多尺度特征序列和拼接任务查询向量执行交叉注意力计算,分别对各任务查询向量执行自注意力计算以更新各任务查询向量;针对各任务,根据经过多次解码处理后得到的任务查询向量执行任务预测,得到任务预测结果。本申请实施例基于多个任务查询向量引入多任务语义解耦机制,提高了对多个任务的协同处理精度。
技术关键词
多尺度特征
多任务
前馈神经网络
注意力
序列
视觉
图像
特征金字塔网络
标签
卷积神经网络模型
融合特征
解耦机制
电子设备
可读存储介质
计算机程序产品
处理器
解码模块
编码模块
系统为您推荐了相关专利信息
文本生成器
数据
图像生成器
随机梯度下降
双模态
深度学习网络模型
补全方法
注意力机制
对称性特征
特征点