摘要
本申请提供了一种图像生成方法及装置。该方法包括:获取参考图像、用户编辑指令、轮廓信息提取指令和深度信息提取指令;从参考图像中提取图像描述信息、轮廓特征、深度特征和图像特征;基于轮廓信息提取指令从图像描述信息中提取轮廓描述信息;基于深度信息提取指令从图像描述信息中提取深度描述信息;根据用户编辑指令、轮廓描述信息和深度描述信息确定图像编辑描述信息;从用户编辑指令中提取用户描述特征,从图像编辑描述信息中提取图像编辑描述特征;根据轮廓特征、深度特征、图像特征、用户描述特征和图像编辑描述特征,利用图像生成模型生成目标图像。采用上述技术手段,解决现有技术中图像生成在灵活性和任务多样性上存在局限的问题。
技术关键词
深度信息提取
轮廓特征
图像生成模型
大语言模型
指令
注意力
融合特征
图像生成方法
编辑
深度图
反馈特征
图像生成装置
文本编码器
图像编码器
可读存储介质
多模态
网络
生成噪声
系统为您推荐了相关专利信息
节能自动控制方法
时间段
数据
节能自动控制系统
通风控制技术
计算机执行指令
客户端
健康状态信息
虚拟桌面云
融合特征