摘要
本发明公开了一种交错扩散优化生成内容对提示词遵从程度的训练方法。其中,所述方法包括:从一数据集中获取图片数据和图片数据以及与该图片数据相对应的文本数据和文本数据;将该图片数据融合第一噪声获得图片数据,并将融合后的图片数据与文本数据输入扩散生成网络模型,获得第一预测噪声;基于该第一预测噪声恢复图片数据,获得图片数据;分析该图片数据与图片数据,获取目标噪声;将该图片数据融合第一噪声获得图片数据,并将图片数据与文本数据再次输入扩散生成网络模型,获得第二预测噪声;基于目标噪声及第二预测噪声训练神经网络模型。本发明能够强化Stable Diffusion的训练过程,从而使其生成的图像结果更加贴近提示词(prompt)。
技术关键词
生成网络模型
图片
噪声
数据
文本
训练装置
训练神经网络模型
训练设备
因子
处理器通信
可读存储介质
模块
存储器
指令
计算机
图像
系统为您推荐了相关专利信息
太阳能光伏阵列
集成学习模型
朴素贝叶斯分类器
逻辑回归分类器
支持向量机分类器
接驳方法
遗传算法
策略
非暂态计算机可读存储介质
接驳装置
小麦产量预测方法
感知特征
种植区
像素点
特征提取器