摘要
本发明公开了一种基于多轮问答的AI图片生成方法,包括:响应于用户自然语言输入,通过大语言模型,得到需求描述,以生成初始图片,其中,需求描述至少包括场景、对象、颜色、风格中的任意之一;根据用户对初始图像的修改语言,得到更新的需求描述,根据需求描述及更新前的需求描述对比,以进行图像更新;进行多次修改迭代,响应于用户确认,生成最终的图片。本发明通过需求对比与迭代生成,解决了用户需求表达不完整、反馈机制缺失及生成结果偏差的核心问题。通过多轮交互逐步补全用户需求,避免信息遗漏;基于差异对比仅调整变更部分,减少冗余计算,高效图像更新;通过多次迭代修正生成模型输入,确保最终图像符合用户预期。
技术关键词
图片生成方法
大语言模型
自然语言
图像
生成式对抗网络
计算机
随机噪声
解码器架构
可读存储介质
语义
编码器
注意力机制
关系
指令
风格
颜色
场景
对象
系统为您推荐了相关专利信息
深度神经网络模型
识别方法
气液两相流流型识别
微结构光纤
测井
飞行模拟器
状态识别方法
模态特征
偏差
特征提取网络
价值评估方法
机器学习模型评估
机器学习训练
训练机器学习模型
代表
DDR3存储器
加速系统
网络模块
网络优化方法
图像