摘要
本发明公开了一种文生图方法、装置、设备及计算机可读存储介质,应用于计算机领域,包括:获取预训练好的文生图扩散模型,文生图扩散模型包括文本编码器和带有专家调整模块的去噪模型;带有专家调整模块的去噪模型包括混合专家模型和主干模型;将文本提示词输入至文本编码器中,得到文本嵌入;根据时间嵌入和文本嵌入,利用混合专家模型确定在不同去噪时间段内激活的目标模型;在不同去噪时间段,通过相对应的目标模型和主干模型对去噪模型自生成的带噪图像进行去噪处理,生成文本提示词对应的图像。本发明提升了文生图扩散模型的表达能力和对不同风格的兼容能力,进而提升了文生图扩散模型的图像生成效果。
技术关键词
图像嵌入
文本编码器
时间段
计算机可执行指令
去噪模型
可读存储介质
输入模块
图像编码器
存储计算机程序
处理器
风格
参数
支路
存储器
噪声
系统为您推荐了相关专利信息
管理控制方法
硬件设备
平台控制器
业务系统运维
管理控制平台
预加载方法
意图
计算机可执行指令
鼠标移动轨迹
资源
动态跟踪方法
模糊PID控制器
表达式
时间段
控制策略
视频会议资源调度
虚拟对象
通道
数据通信测试
动画