摘要
本申请公开了一种数据处理方法、装置、设备及可读存储介质,该方法包括:通过视觉编码模型对样本图像数据进行特征提取,得到视觉编码特征向量;通过初始投射层对视觉编码特征向量进行线性变换,得到初始投射特征向量,通过初始生成模型和初始投射特征向量,生成第一图像数据;对初始投射层和初始生成模型进行调整,得到目标投射层和目标生成模型;通过目标投射层对视觉编码特征向量进行线性变换,得到目标投射特征向量,通过目标生成模型和目标投射特征向量,生成第二图像数据;对视觉编码模型进行调整,得到视觉增强编码模型。采用本申请,可以提高视觉编码模型所提取得到的视觉特征的准确性。
技术关键词
图像特征向量
注意力
视觉特征
矩阵
样本
多模态
参数
数据处理方法
计算机设备
计算机程序产品
图像编码
可读存储介质
处理器
数据通信功能
网络接口
系统为您推荐了相关专利信息
运动状态估计方法
多普勒频率估计
短时傅里叶变换
图像分割
估计算法
机器人操作系统
多模态交互
多模态数据融合
注意力
画像