摘要
本公开提供了一种文生图场景下的模型训练方法、装置、设备及存储介质,属于人工智能技术领域。针对文生图场景,本公开提供的训练框架包括第一分支和第二分支。其中,第一分支与第二分支中均包括文生图模型。在第一训练阶段,文生图模型在第一分支的模型参数被冻结,在第二分支的模型参数被更新。即,该方案在原有分支的基础上额外引入了一条会冻结模型参数的分支。这个分支上的文生图模型在第一训练阶段不参与训练,仅在第二训练阶段进行参数更新,但是训练过程中仅会对第一分支的文生图模型施加结构信息的引导,并不会破坏文生图模型原有的生成能力,因此为第二分支提供了对齐文生图模型原有生成能力的目标。
技术关键词
模型训练方法
噪声预测
分支
交互特征
场景
文本
矩阵
阶段
电子设备
中间层
编码
参数
可执行程序代码
解码
模型训练装置
处理器
可读存储介质
人工智能技术
计算机程序产品
系统为您推荐了相关专利信息
分布式计算框架
分块
关键帧
网络传输开销
NTP服务器
数据
风险检测方法
模型训练模块
决策树模型
案件