一种基于孪生扩散模型的多视角人物图像重建方法及装置

正文

推荐专利

申请号：CN202510594067

申请日期：2025-05-09

公开号：CN120125473B

公开日期：2025-09-16

类型：发明专利

摘要

本发明公开了一种基于孪生扩散模型的多视角人物图像重建方法及装置，该方法获取二维RGB参考人物图像和二维RGB目标人物图像构成训练数据对，基于二维RGB目标人物图像得到对应的姿态图像，提取总体人体语义分割掩码图和局部区域分割图，对训练数据对编码为潜在特征并添加随机噪声，基于孪生扩散模型进行特征融合和去噪过程，进行图像复原，最后基于解码器得到最终目标人物图像。本发明采用孪生扩散模型框架来克服先前传统方法保留细粒度信息能力弱的固有缺点，有效提高了具有复杂图案衣服的人物外观一致性，克服了传统先前方法在参考人物姿态与目标姿态变化过大时无法合理生成的问题，显著提升了生成图片的质量。

技术关键词

图像重建方法多层卷积网络视角关键点姿态特征人体随机噪声语义图像重建装置特征提取网络变量姿势解码器姿态估计计算机程序产品插值方法处理器注意力编码器

系统为您推荐了相关专利信息

基于PIR和AI行为分析的智能安防对讲系统

智能安防对讲系统多模态响应视频采集模块动态资源调度分析模块

一种基于行为关键点多目标会议场景下行为分析方法

会议场景分析方法视频状态空间模型对象

一种证件照生成方法及电子设备

图像生成模型模板变形算法面部结构扩散算法

一种基于单视角人脸图像的三维人头模型重建方法

人头模型图像视角生成对抗网络相机

一种面向机械设计知识长期记忆的AI处理方法及系统

记忆图表多智能体协同非结构化文本信息逻辑推理技术

一种基于孪生扩散模型的多视角人物图像重建方法及装置

站点导航

APP 下载