一种基于孪生扩散模型的多视角人物图像重建方法及装置

AITNT
正文
推荐专利
一种基于孪生扩散模型的多视角人物图像重建方法及装置
申请号:CN202510594067
申请日期:2025-05-09
公开号:CN120125473B
公开日期:2025-09-16
类型:发明专利
摘要
本发明公开了一种基于孪生扩散模型的多视角人物图像重建方法及装置,该方法获取二维RGB参考人物图像和二维RGB目标人物图像构成训练数据对,基于二维RGB目标人物图像得到对应的姿态图像,提取总体人体语义分割掩码图和局部区域分割图,对训练数据对编码为潜在特征并添加随机噪声,基于孪生扩散模型进行特征融合和去噪过程,进行图像复原,最后基于解码器得到最终目标人物图像。本发明采用孪生扩散模型框架来克服先前传统方法保留细粒度信息能力弱的固有缺点,有效提高了具有复杂图案衣服的人物外观一致性,克服了传统先前方法在参考人物姿态与目标姿态变化过大时无法合理生成的问题,显著提升了生成图片的质量。
技术关键词
图像重建方法 多层卷积网络 视角 关键点 姿态特征 人体 随机噪声 语义 图像重建装置 特征提取网络 变量 姿势 解码器 姿态估计 计算机程序产品 插值方法 处理器 注意力 编码器
系统为您推荐了相关专利信息
1
基于PIR和AI行为分析的智能安防对讲系统
智能安防对讲系统 多模态响应 视频采集模块 动态资源调度 分析模块
2
一种基于行为关键点多目标会议场景下行为分析方法
会议场景 分析方法 视频 状态空间模型 对象
3
一种证件照生成方法及电子设备
图像生成模型 模板 变形算法 面部结构 扩散算法
4
一种基于单视角人脸图像的三维人头模型重建方法
人头模型 图像 视角 生成对抗网络 相机
5
一种面向机械设计知识长期记忆的AI处理方法及系统
记忆 图表 多智能体协同 非结构化文本信息 逻辑推理技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号