基于交互控制的文本到图像生成方法、系统、设备及介质

AITNT
正文
推荐专利
基于交互控制的文本到图像生成方法、系统、设备及介质
申请号:CN202510413253
申请日期:2025-04-03
公开号:CN119919526B
公开日期:2025-07-25
类型:发明专利
摘要
本申请公开了一种基于交互控制的文本到图像生成方法、系统、设备及介质,该方法通过构建包含第一编码器和第一解码器的文本到图像扩散模型,以及,构建包含第二编码器和第二解码器的图像到文本模型;将文本到图像扩散模型与图像到文本模型连接,构建图像生成模型;采用训练噪声图像、第一交互信息和第一文本信息训练构建好的图像生成模型,得到训练好的图像生成模型;将待生成噪声图像、第二交互信息和第二文本信息输入至训练好的图像生成模型中的文本到图像扩散模型,得到多张生成图像;将多张生成图像输入至训练好的图像生成模型中的图像到文本模型,筛选出目标生成图像。本申请能够提高图像生成的质量。
技术关键词
图像生成模型 文本 图像生成方法 生成噪声 噪声图像 交叉注意力机制 编码器 解码器 交互实体 计算机可执行指令 令牌 分词 图像生成系统 图像生成单元 数据获取单元 可读存储介质 处理器
系统为您推荐了相关专利信息
1
文本处理方法、装置、电子设备以及存储介质
文本处理方法 关键词 层级 拓扑图 摘要
2
法律支持系统的控制方法、设备及存储介质
案件 实体 解析方法 生成法律文书 关系
3
一种基于整体语义特征提取的中文文字识别方法
中文文字识别方法 语义特征提取 局部注意力机制 多头注意力机制 解码
4
一种半导体测试方法
半导体测试方法 SIMD指令集 硬件板卡 周期 自动化测试设备
5
一种基于大语言模型的数据结构自适应可视化方法
大语言模型 非结构化文本 可视化方法 金融 风险
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号