一种文本生成图像方法、装置、设备及介质

AITNT
正文
推荐专利
一种文本生成图像方法、装置、设备及介质
申请号:CN202510244910
申请日期:2025-03-03
公开号:CN119722875B
公开日期:2025-05-13
类型:发明专利
摘要
本申请涉及图像处理技术领域,公开了一种文本生成图像方法、装置、设备及介质,其中,方法包括:响应于获取到的包含目标对象的文本提示词,生成文本提示词对应的初始图像;其中,文本提示词包括目标对象的目标数量,初始图像包括目标对象的生成数量;在目标数量与生成数量不相等的情况下,对初始图像生成过程中的候选边界框的位置进行优化,生成优化后的边界框;基于优化后的边界框对初始图像生成过程中的当前潜在表示进行优化,得到目标潜在表示;基于目标潜在表示更新初始图像,生成目标图像,以使目标图像中目标对象的生成数量与目标数量相等。本申请提供的技术方案,能够精确控制生成图像中目标数量。
技术关键词
文本生成图像方法 注意力 对象 图像生成单元 可读存储介质 图像处理技术 存储器 处理器 指令 掩膜 计算机设备 像素点 因子 坐标
系统为您推荐了相关专利信息
1
一种基于听觉仿生模型的特高频传感器去噪方法
特高频传感器 数字变频技术 局部放电特征 去噪方法 频带划分方法
2
分布式系统的代价评估方法、装置、设备、介质及产品
系统性能分析 分布式策略 代价评估方法 分布式系统 可视化图表
3
一种基于空间状态注意力U型网络的红外小目标检测方法及装置
图像 编码器 解码器 残差网络 梯度下降算法
4
基于模块复用的物理层芯片设计生成方法、设备和介质
模块 芯片 设计生成方法 逻辑 列表
5
基于气体吸附法确定孔径分布的方法、装置、设备及存储介质
正则化参数 粗糙度 内核 矩阵 三次样条曲线
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号