摘要
本发明公开了一种基于条件扩散模型的无交叉注意力姿态迁移方法,该方法用预训练的VAE编码器对输入统一编码,以三个平行的U‑Net为基础,不同的U‑Net提取不同输入的多级特征,并在主干U‑Net直接相加并通过自注意力机制进行特征融合。训练时,以独立的概率随机置两个条件图像为空。采样时,以单个条件对应的预测噪声为基础,混合两个条件相对于单个条件对输出造成的差异。统一编码减小了模型的学习难度。自注意力机制计算融合特征中不同信息之间的关系,更有效地利用高相关性的特征。独立置空策略促进网络学习单个条件引入的差异。混合噪声引导基础噪声向条件控制更强的方向修正,避免了两个条件均置空时噪声训练不足,从而提高生成图像的保真性和一致性。
技术关键词
迁移方法
图像编码
噪声
编码器
阶段
注意力机制
检查点
多级特征
基础
融合特征
网络结构
算法
解码器
通道
参数
计划
系统为您推荐了相关专利信息
混合并行计算方法
流水线并行计算
并行训练方法
划分算法
集群系统
融合特征
语音
音频
Attention机制
网络
多源异构数据采集系统
滑动窗口机制
中央数据处理单元
传感器节点
融合多源数据
数据异常检测方法
异常数据
清洗策略
噪声数据
隐性特征