摘要
本发明公开了一种基于扩散模型的双模态人脸局部编辑方法及相关设备,其中模型包含图像局部提示处理模块、文本提示处理模块、隐空间扩散模型、图像编码器与解码器、文本‑图像注意力处理算法、空文本反演算法;通过文本、图像两种解耦注意力结合,细粒度地对图像进行局部编辑。一方面,文本注意力使用较粗粒度的语义引导,源图像对应部分语义发生改变。另一方面,文本难以描述的部分,可以通过图像注意力进行语义引导。经过文本注意力粗粒度的语义引导结合图像注意力细粒度的语义引导,最终实现细粒度的人脸编辑任务。本发明具有较强的灵活性与实用性,可在人脸个性化生成、编辑任务中具备实际应用价值,可广泛应用于计算机视觉领域。
技术关键词
注意力
编辑方法
图像编码器
人脸语义
文本编码器
图像嵌入
适配器
双模态
矩阵
协作策略
分支
噪声
去噪模型
反演算法
计算机程序产品
系统为您推荐了相关专利信息
农作物灾害监测
地理位置编码
子模块
气象预报数据
多时间尺度
电子元件识别方法
轮廓特征
注意力机制
手眼标定
压缩特征
传感器节点
渗滤液
电阻率成像技术
风险预警方法
神经网络预测模型
特征提取模块
注意力
语义向量
非暂态计算机可读存储介质
文本