摘要
本发明公开了一种基于扩散模型的图像与视频重建方法、系统、终端及存储介质,所述方法包括:获取原始图像数据和原始文本描述,并输入至扩散模型,得到噪声数据和中间特征;确定时间步预测模型,并通过时间步预测模型和扩散模型对噪声数据、中间特征以及原始文本描述进行反向生成处理,得到初始图像数据;根据初始图像数据对所述时间步预测模型进行更新,得到更新时间步预测模型;获取更新文本描述,并通过更新时间步预测模型和扩散模型对噪声数据、中间特征以及更新文本描述进行反向生成处理,得到目标图像数据。本发明能够有效提高扩散模型的重建能力,并实现对原始图像数据的精准重建。
技术关键词
原始图像数据
视频重建方法
噪声数据
重建误差
文本
重建系统
可读存储介质
处理器
模型更新
终端
注意力机制
表达式
键值
程序
信号
模块
关键词
系统为您推荐了相关专利信息
场景理解方法
三维点云数据
点云特征提取
文本
强化特征
文本纠正方法
非暂态计算机可读存储介质
加权特征
词语
纠正装置
生成对抗网络
图像生成方法
多模态
图像生成技术
像素点
人工智能模型
机器学习模型
网络流量异常分析
集成学习方法
深度学习算法