摘要
本申请关于一种图像处理方法、装置、电子设备及存储介质,该方法包括:获取第一待处理噪声图像、描述文本,以及所述描述文本对应的初始图像序列,将初始图像序列输入自注意力网络,以提取初始图像序列中初始图像间的关联关系,得到第一图像特征信息;基于第一图像特征信息和第一待处理噪声图像进行噪声预测得到第一更新噪声信息;基于第一更新噪声信息进行噪声预测得到第一预测噪声信息,并对第一待处理噪声图像进行图像去噪得到目标图像。本申请能够提取长序列图像中的关联关系,提升文本与生成图像间的一致性,且使生成图像保持较高一致性。
技术关键词
噪声信息
噪声图像
图像特征信息
注意力
噪声预测
文本
查询特征
图像处理方法
键特征
序列
图像编码
网络
多模态
矩阵
场景特征
电子设备
融合特征
图像处理装置
可读存储介质