一种基于多轮问答的AI图片生成方法

正文

推荐专利

一种基于多轮问答的AI图片生成方法

申请号：CN202510863044

申请日期：2025-06-25

公开号：CN120747276A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种基于多轮问答的AI图片生成方法，包括：响应于用户自然语言输入，通过大语言模型，得到需求描述，以生成初始图片，其中，需求描述至少包括场景、对象、颜色、风格中的任意之一；根据用户对初始图像的修改语言，得到更新的需求描述，根据需求描述及更新前的需求描述对比，以进行图像更新；进行多次修改迭代，响应于用户确认，生成最终的图片。本发明通过需求对比与迭代生成，解决了用户需求表达不完整、反馈机制缺失及生成结果偏差的核心问题。通过多轮交互逐步补全用户需求，避免信息遗漏；基于差异对比仅调整变更部分，减少冗余计算，高效图像更新；通过多次迭代修正生成模型输入，确保最终图像符合用户预期。

技术关键词

图片生成方法大语言模型自然语言图像生成式对抗网络计算机随机噪声解码器架构可读存储介质语义编码器注意力机制关系指令风格颜色场景对象

系统为您推荐了相关专利信息

一种基于DAS测井数据的气液两相流流型识别方法

深度神经网络模型识别方法气液两相流流型识别微结构光纤测井

基于多模态学习的飞行模拟器测试数据状态识别方法、系统及设备

飞行模拟器状态识别方法模态特征偏差特征提取网络

一种基于大模型量化和机器学习的NFT价值评估方法

价值评估方法机器学习模型评估机器学习训练训练机器学习模型代表

一种YOLOv10在轨遥感图像目标检测网络优化方法及FPGA加速系统

DDR3存储器加速系统网络模块网络优化方法图像

一种中医音乐疗法辅助临床心理治疗的方法及系统

序列音色特征数据感官时间同步算法

一种基于多轮问答的AI图片生成方法

站点导航

APP 下载