多模态引导的渐进式图像生成方法

正文

推荐专利

多模态引导的渐进式图像生成方法

申请号：CN202510369207

申请日期：2025-03-27

公开号：CN119888015B

公开日期：2025-08-22

类型：发明专利

摘要

本发明涉及图像处理领域，具体涉及一种多模态引导的渐进式图像生成方法，包括：为接收数据生成多模态的特征；通过噪声采样和多模态特征融合方法，利用布局去噪网络为每个主体对象生成层最终布局；通过反演算法提取参考图像的潜在编码，结合层文本编码经稳定扩散模型迭代去噪，提取参考键值矩阵；将初始噪声、层最终布局、多模态的特征及参考键值矩阵输入分层扩散模型，经多步去噪后通过解码生成主体透明图层；将所有主体透明图层叠加形成混合图像后，基于全局文本编码驱动图像恢复网络生成目标图像。本发明解决了现有方法在处理复杂场景时的缺陷；确保了生成的图像在全局和局部都能与文本描述保持一致。

技术关键词

图像生成方法约束特征注意力多模态对象文本布局视觉噪声图像编码掩码矩阵模态特征融合方法代表多层感知机层分层反演算法

系统为您推荐了相关专利信息

基于多源数据融合的降水数据处理方法及装置

地形高程数据数据降尺度数据处理方法地形特征提取融合特征

一种基于非接触式视频信号分析的压疮分期方法及系统

视频信号分析多模态深度学习多模态生理非接触式视频流

基于目标自适应-层级融合Transformer的工业质量变量预测方法

注意力变量预测方法编码器层级传播算法

影像组学脑网络到形态学脑网络的预测方法、系统和设备

影像空间特征提取网络特征组学特征融合特征

一种聚氨酯防腐涂料的制备方法

聚氨酯防腐涂料滑动时间窗口聚氨酯预聚体空间特征提取波动特征

多模态引导的渐进式图像生成方法

站点导航

APP 下载