一种基于扩散模型的布局可控图像个性化生成方法

AITNT
正文
推荐专利
一种基于扩散模型的布局可控图像个性化生成方法
申请号:CN202510118789
申请日期:2025-01-24
公开号:CN120014117A
公开日期:2025-05-16
类型:发明专利
摘要
本发明公开了一种基于扩散模型的布局可控图像个性化生成方法,包括:1、获取视频和图像数据以及对应的文本描述、掩码和边界框标注;2、构建扩散模型适配器,嵌入参考主体特征、边界框和文本描述;3、对构建的扩散模型适配器进行离线训练;4、利用训练好的模型进行生成,以实现对给定图像主体进行主体驱动的定制化生成的目标。本发明通过利用轻量适配器引入位置信息和参考主体特征的方式,实现了任意位置生成任意参考物体的能力,提升了主体特征保持能力和位置可控性,从而允许用户自主生成高度定制的图像。
技术关键词
个性化生成方法 注意力 文本编码器 静态特征 实例分割 图像 多层感知机 命名实体识别模型 适配器 布局 动态 视觉特征 标签 变量 标记 嵌入特征 采样器 视频
系统为您推荐了相关专利信息
1
基于边界优化的医学图像分割方法
医学图像分割方法 模糊边界 分割医学图像 编码器 高层语义特征
2
多模态融合的3D目标检测方法、装置、设备及存储介质
多头注意力机制 三维场景空间 前馈神经网络 神经网络训练 图像处理
3
基于多模态数据融合的AR动态环境感知算法的方法
多模态数据融合 环境风险评估 子模块 多模态数据采集 环境风险监测技术
4
一种基于人工智能的有害气体泄漏检测方法
气体泄漏检测方法 二维高斯模型 时序特征 多模态数据融合 时间卷积网络
5
施工现场安全检测方法、装置、设备及介质
建筑信息模型 施工现场 便携相机 热力图 坐标点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号