摘要
本申请公开了一种图像生成方法、装置、设备及存储介质,涉及图像生成与编辑领域,包括:对获取的初始RGB图像执行预设粗粒度分割操作得到粗分割掩码,根据粗分割掩码对初始RGB图像进行预设图像处理操作获取目标RGBA图像,将初始RGB图像及目标RGBA图像输入预设视觉大模型得到目标描述文本;利用获取的目标图像生成模型中的预设双编码器分析目标描述文本,以提取表观特征和解析三维结构描述词得到第一语义特征向量;预设双编码器包括视觉编码器和文本编码器;基于第一语义特征向量生成参考对象图像,根据预设检测模型获取多维特征信息,利用目标图像生成模型基于多维特征信息生成目标RGB图像。能够提高生成物体图像的准确性。
技术关键词
图像生成模型
图像生成方法
双编码器
对象
三维结构
文本编码器
语义
色彩直方图
视觉
图像处理
生成物体图像
注意力机制算法
边缘检测模型
实例分割模型
透明度
图像生成装置
白点
系统为您推荐了相关专利信息
三维仿真模型
智能感知系统
三维地质模型
盾构隧道
终端
动态卷积神经网络
节点
文本特征向量
图像生成方法
图像生成模型
结构化查询语句
生成方法
大语言模型
校验模型
关键词