摘要
本申请公开了一种图像布局处理方法,包括:获取背景图像,将背景图像述输入到视觉表示模块中进行图像处理和特征提取,得到第一视觉特征序列;获取将要在背景图像中进行布局显示的布局信息,将布局信息输入到布局信息表示模块中进行编码,得到第一布局特征序列;将第一视觉特征序列和第一布局特征序列输入到多模态融合模块中进行融合,得到多模态条件控制序列;将多模态条件控制序列作为控制条件输入到条件去噪模型,通过多轮去噪处理,得到布局信息在背景图像中的布局位置。该方法能够提高将文字等信息布局在图像中的设计和处理效率。
技术关键词
布局特征
视觉特征
变换编码器
去噪模型
序列
交叉注意力机制
多模态
图像处理
坐标
元素
计算机程序产品
模块
可读存储介质
语义
系统为您推荐了相关专利信息
数据安全传输方法
风力发电厂设备
动态密钥
矩阵
数据加密
激光焊接控制系统
激光焊接控制方法
强化学习策略
频谱特征提取
特征提取模块
服务集群
负载均衡策略
自动扩展方法
时间序列预测技术
服务端