基于隐式多模态引导对齐的扩散生成方法

AITNT
正文
推荐专利
基于隐式多模态引导对齐的扩散生成方法
申请号:CN202510063727
申请日期:2025-01-15
公开号:CN119919465A
公开日期:2025-05-02
类型:发明专利
摘要
本申请提供了一种基于隐式多模态引导对齐的扩散生成方法,涉及图像处理技术领域。本申请中,对于扩散生成的图像以及预期文本提示,通过多模态大语言模型生成对扩散模型生成的初始图像进行对齐的隐式多模态引导特征;通过隐式对齐器器,通过操作隐藏特征来对齐扩散模型生成的初始图像中与预期提示文本不匹配的特征;本申请提出的基于隐式多模态引导对齐的扩散生成方法在不牺牲输出质量的情况下有效地减少了生成图像和预期文本提示之间的不匹配。
技术关键词
扩散生成方法 大语言模型 多模态 文本 指令 编辑 对齐模块 三元组 生成装置 编码器 处理器 网络 特征提取模块 图像处理技术 计算机程序产品 可读存储介质 存储器 参数 算法
系统为您推荐了相关专利信息
1
一种无人艇路径跟踪控制方法
路径跟踪控制方法 无人艇 偏差 PID控制器 参数
2
大模型的提示词生成方法、装置、设备及介质
生成方法 数据编码器 文本段落 语义特征提取 文本特征向量
3
一种基于文本描述的不可见物体4D人物交互生成方法
关键帧 物体 人体运动模型 重建人体 交互注意力
4
样本数据的生成方法、装置、设备及计算机可读存储介质
交易特征 字段 数据 样本 计算机程序指令
5
一种多信息二三维展示的应用管理系统
多信息 多维特征数据 政务 实时数据 大数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号