一种基于扩散模型的图像与视频重建方法、系统、终端及存储介质

正文

推荐专利

申请号：CN202510365205

申请日期：2025-03-26

公开号：CN119888014B

公开日期：2025-07-22

类型：发明专利

摘要

本发明公开了一种基于扩散模型的图像与视频重建方法、系统、终端及存储介质，所述方法包括：获取原始图像数据和原始文本描述，并输入至扩散模型，得到噪声数据和中间特征；确定时间步预测模型，并通过时间步预测模型和扩散模型对噪声数据、中间特征以及原始文本描述进行反向生成处理，得到初始图像数据；根据初始图像数据对所述时间步预测模型进行更新，得到更新时间步预测模型；获取更新文本描述，并通过更新时间步预测模型和扩散模型对噪声数据、中间特征以及更新文本描述进行反向生成处理，得到目标图像数据。本发明能够有效提高扩散模型的重建能力，并实现对原始图像数据的精准重建。

技术关键词

原始图像数据视频重建方法噪声数据重建误差文本重建系统可读存储介质处理器模型更新终端注意力机制表达式键值程序信号模块关键词

系统为您推荐了相关专利信息

一种基于双流特征融合的三维点云开放场景理解方法

场景理解方法三维点云数据点云特征提取文本强化特征

一种文本纠正方法及装置

文本纠正方法非暂态计算机可读存储介质加权特征词语纠正装置

一种基于大数据处理的图像生成方法及系统

生成对抗网络图像生成方法多模态图像生成技术像素点

基于生成式人工智能的网络流量异常分析方法及其系统

人工智能模型机器学习模型网络流量异常分析集成学习方法深度学习算法

一种基于图像识别的发票信息定位截取系统及方法

截取系统发票字符识别数据处理单元格式

一种基于扩散模型的图像与视频重建方法、系统、终端及存储介质

站点导航

APP 下载