摘要
本发明涉及一种文生图及模型训练方法、装置、电子设备和存储介质。针对现有技术中多概念生成时存在的生成结果与概念错配、概念学习不充分等问题,本发明提出一种新的文生图模型训练方案及相对应的装置、电子设备和存储介质。通过引入多个专家LoRA网络,每个网络对应一个概念,结合专家控制网络预测各专家网络的激活概率,实现多概念图像的准确生成。训练时,分别输入单概念和多概念图文对,计算预测噪声和专家激活信息,调整模型参数。生成时,根据输入文本预测专家激活信息,结合专家网络输出和降噪网络输出进行降噪处理,生成目标图像。本发明提高了文生图模型在多概念场景下的生成准确性和灵活性,为文生图技术的发展提供了新的思路和方法。
技术关键词
图文
概念
输出特征
模型训练方法
网络
注意力
噪声
模型训练装置
对象
图像
文本编码器
电子设备
样本
输入设备
参数
存储程序指令
处理器
训练集
光盘
系统为您推荐了相关专利信息
数字化管理系统
数据画像
混凝土温度场
马尔可夫链模型
LSTM神经网络
身份证图像
平行线
定位校正方法
字符
定位校正装置
微环谐振器阵列
绝热耦合
集成芯片
密集波分复用
光栅耦合器
肿瘤图像分割方法
特征提取模块
层级
通道
前馈神经网络
寿命预警方法
电解电容
LOF算法
一致性检测
神经网络模型