一种基于交叉注意力重分配的多实例可控图像生成方法

AITNT
正文
推荐专利
一种基于交叉注意力重分配的多实例可控图像生成方法
申请号:CN202410772782
申请日期:2024-06-17
公开号:CN118628611B
公开日期:2025-09-19
类型:发明专利
摘要
本发明公开了一种基于交叉注意力重分配的多实例可控图像生成方法,首先构建ChatGPT代码提示链CoC。然后在ChatGPT中使用代码提示链,生成符合多实例文本提示生成任务中所需要的布局。然后在扩散模型每一个时间步中获得交叉注意力图,并基于布局信息,获得两个引导损失。最后使用损失引导修改当前时间步上的预测噪声,迭代优化的噪声图像最终通过解码器得到生成的多实例可控图像。本发明缓解实体缺失、属性互换、属性泄露、空间布局错误等问题的出现,在图像编辑、个性化生成和虚拟试衣等领域中实现更准确、高质量的图像生成和修改,为用户提供更符合个性化需求的服务。
技术关键词
图像生成方法 注意力 布局 优化噪声 文本编码器 令牌 补丁 对象 噪声图像 解码器 多实例 定义 虚拟试衣 噪声样本 大语言模型 嵌入特征
系统为您推荐了相关专利信息
1
一种家畜体尺测量方法、系统、计算机设备及存储介质
家畜 多分辨率特征 点云局部 测量方法 特征信息处理
2
一种基于分组的设备间屏柜自动布置方法
屏柜 自动布置方法 房间 列表 数学模型
3
一种人工智能语音识别系统
语音特征 编码器 文本 强化学习框架 多头注意力机制
4
面向稀疏观测的爆炸超压场物理增强重构方法及系统
重构模型 特征辨识模块 混合特征提取 积层 多场景
5
图像生成方法、装置、智能体、智能体系统及存储介质
生成方式 图像主体 文本 意图 图像生成方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号