摘要
本申请涉及图像处理技术领域,提供了一种图像的布局方法、装置、电子设备及可读存储介质。该方法包括:获取待布局对象的文本描述信息和参考图像,文本描述信息包括待布局对象的文本信息和/或位置框信息;通过布局特征提取模块对文本描述信息进行处理,得到文本描述信息的布局特征;通过文本编码器对文本描述信息进行处理,得到文本描述信息的文本特征;通过图像编码器对参考图像进行处理,得到参考图像的图像特征;通过扩散模型对布局特征、文本特征和图像特征进行融合处理,生成待布局对象的目标布局图像。解决了现有图像布局方法不能准确反映用户期望布局的技术问题。
技术关键词
布局特征
融合特征
前馈神经网络
多模态注意力
特征提取模块
输出特征
文本编码器
图像编码器
图像拼接
对象
语义特征提取
图像布局方法
拼接模块
编码模块
自然语言
系统为您推荐了相关专利信息
跨模态融合特征
多模态
高维特征向量
图像特征向量
检测数据输入
分类模型训练方法
时域特征
融合特征
频域特征
短时傅里叶变换
鉴定系统
多模态数据采集
指纹特征
鉴定艺术品
特征模板
智能识别模块
多模型融合策略
特征提取模块
数据采集模块
卷积神经网络模型
多源监测数据
调控模型
调控策略
采空区
数字孪生模型