一种基于扩散模型的双模态人脸局部编辑方法及相关设备

AITNT
正文
推荐专利
一种基于扩散模型的双模态人脸局部编辑方法及相关设备
申请号:CN202510850189
申请日期:2025-06-24
公开号:CN120782879A
公开日期:2025-10-14
类型:发明专利
摘要
本发明公开了一种基于扩散模型的双模态人脸局部编辑方法及相关设备,其中模型包含图像局部提示处理模块、文本提示处理模块、隐空间扩散模型、图像编码器与解码器、文本‑图像注意力处理算法、空文本反演算法;通过文本、图像两种解耦注意力结合,细粒度地对图像进行局部编辑。一方面,文本注意力使用较粗粒度的语义引导,源图像对应部分语义发生改变。另一方面,文本难以描述的部分,可以通过图像注意力进行语义引导。经过文本注意力粗粒度的语义引导结合图像注意力细粒度的语义引导,最终实现细粒度的人脸编辑任务。本发明具有较强的灵活性与实用性,可在人脸个性化生成、编辑任务中具备实际应用价值,可广泛应用于计算机视觉领域。
技术关键词
注意力 编辑方法 图像编码器 人脸语义 文本编码器 图像嵌入 适配器 双模态 矩阵 协作策略 分支 噪声 去噪模型 反演算法 计算机程序产品
系统为您推荐了相关专利信息
1
一种粮食主产区农作物灾害监测预警评估平台
农作物灾害监测 地理位置编码 子模块 气象预报数据 多时间尺度
2
基于轻量级多注意力的SMT点胶电子元件识别方法及系统
电子元件识别方法 轮廓特征 注意力机制 手眼标定 压缩特征
3
一种固废堆场安全风险预警方法
传感器节点 渗滤液 电阻率成像技术 风险预警方法 神经网络预测模型
4
复合风格语音的生成方法、装置、设备及存储介质
风格 语音特征 语音合成器 语义 文本编码器
5
训练对话模型的方法、对话实现方法及相关装置
特征提取模块 注意力 语义向量 非暂态计算机可读存储介质 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号