一种双模态协同控制的布局可控主体一致性广告生成方法

AITNT
正文
推荐专利
一种双模态协同控制的布局可控主体一致性广告生成方法
申请号:CN202510211618
申请日期:2025-02-25
公开号:CN120219002A
公开日期:2025-06-27
类型:发明专利
摘要
本发明公开了一种双模态协同控制的布局可控主体一致性广告生成方法,针对文本‑图像扩散模型在广告制作等场景中存在的问题,定义布局到主体一致的图像生成任务。该模型采用双模态协同控制的无训练管道,包含一致性前向采样阶段与布局条件反向更新阶段。前向采样阶段利用IP‑Adapter图像一致性生成方法,处理语义空间特征,对文本特征和一致性图像特征采用解耦的交叉注意力机制,维护图像生成主体的一致性。反向更新阶段利用用户输入的边框信息引入三种布局可控损失:框内损失,边框损失,框外损失,处理隐空间特征,更新隐空间的去噪方向,实现布局可控生成。实验结果表明本发明有效解决了布局到主体一致的图像生成任务,并提升了图像生成质量。
技术关键词
广告生成方法 双模态 布局 掩码矩阵 物体 协同控制策略 交叉注意力机制 语义 文本编码器 解码器 图像编码器 超参数 更新方法 元素
系统为您推荐了相关专利信息
1
一种用于拼接窗口的视频画面展示比例调整的方法及系统
视频流 过渡动画 对象 关键点 画面
2
一种基于动态环境感知的无人船激光测距优化方法及系统
无人船 动态障碍物 路径规划算法 激光测距数据 复杂度
3
医院的低碳选址布局方法、装置、设备和存储介质
医院 居民 布局方法 交通环境信息 矩阵
4
一种基于单张图像的物体点云重建方法及相关装置
三维点云信息 点云重建方法 视角 物体 像素点
5
基于电力物资射频识别的物资流转路径构建方法
路径构建方法 Dijkstra算法 RFID读写设备 节点 RFID标签信息
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号