摘要
本发明涉及金融、医疗健康及人工智能技术领域,提供一种基于模态注入的图像生成方法、装置、设备及介质,能够将目标模态标识输入至门控函数得到目标路由信息,并根据目标路由信息从预先构建的多模态条件模块库中匹配目标多模态条件模块,从而结合门控函数快速检索到与目标模态标识相匹配的目标多模态条件模块,实现多模态的灵活控制;将目标多模态条件模块嵌入至预训练的扩散模型得到目标模型,及将初始图像输入至目标模型进行图像生成处理得到目标图像,由于多模态条件模块具有轻量级、即插即用的属性,因此能够在不改变原始扩散模型的前提下实现多模态条件注入控制的图像生成,不仅提升了模型的迁移能力,且降低了图像生成成本。
技术关键词
图像生成方法
多模态
模块
生成指令
图像生成装置
计算机设备
标识
手绘草图
可读存储介质
人工智能技术
医疗健康
参数
数据
解析单元
深度图
存储器
处理器
系统为您推荐了相关专利信息
组件特征
深度强化学习模型
污泥
波动特征
预测特征
换电站
温度调节系统
电池热管理系统
电池热管理方法
电池热管理装置
可再生能源消纳能力
新能源消纳能力
火电
新能源机组
机组运行状态