图像的布局方法、装置、电子设备及可读存储介质

AITNT
正文
推荐专利
图像的布局方法、装置、电子设备及可读存储介质
申请号:CN202510946341
申请日期:2025-07-09
公开号:CN120852593A
公开日期:2025-10-28
类型:发明专利
摘要
本申请涉及图像处理技术领域,提供了一种图像的布局方法、装置、电子设备及可读存储介质。该方法包括:获取待布局对象的文本描述信息和参考图像,文本描述信息包括待布局对象的文本信息和/或位置框信息;通过布局特征提取模块对文本描述信息进行处理,得到文本描述信息的布局特征;通过文本编码器对文本描述信息进行处理,得到文本描述信息的文本特征;通过图像编码器对参考图像进行处理,得到参考图像的图像特征;通过扩散模型对布局特征、文本特征和图像特征进行融合处理,生成待布局对象的目标布局图像。解决了现有图像布局方法不能准确反映用户期望布局的技术问题。
技术关键词
布局特征 融合特征 前馈神经网络 多模态注意力 特征提取模块 输出特征 文本编码器 图像编码器 图像拼接 对象 语义特征提取 图像布局方法 拼接模块 编码模块 自然语言
系统为您推荐了相关专利信息
1
一种多模态有害信息检测方法、装置及电子设备
跨模态融合特征 多模态 高维特征向量 图像特征向量 检测数据输入
2
脑卒中后构音障碍分类模型训练方法、分类方法及装置
分类模型训练方法 时域特征 融合特征 频域特征 短时傅里叶变换
3
基于A1与区块链的多模态艺术品指纹真伪鉴定系统
鉴定系统 多模态数据采集 指纹特征 鉴定艺术品 特征模板
4
一种基于人工智能的图像识别与处理系统及方法
智能识别模块 多模型融合策略 特征提取模块 数据采集模块 卷积神经网络模型
5
一种基于强化学习的采空区三带注浆动态调控方法及系统
多源监测数据 调控模型 调控策略 采空区 数字孪生模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号