一种基于联合扩散建模的图像生成与理解统一方法及系统

AITNT
正文
推荐专利
一种基于联合扩散建模的图像生成与理解统一方法及系统
申请号:CN202511205486
申请日期:2025-08-27
公开号:CN120953442A
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开了一种基于联合扩散建模的图像生成与理解统一方法及系统,其涉及图像生成和理解技术领域。本发明通过联合扩散建模统一图像生成与理解任务,无需为生成和理解任务分别设计模型,提升效率。通过改进的DINOv2、Segmenter、DETR模型增强了分类特征类簇聚合性、分割边界细节及检测中小目标特征表达。随机角色分配机制和掩码全注意力机制灵活处理多域信息,域不变位置编码辅助跨域对齐,提升建模精度。通过优化训练使模型同时支持联合生成、可控生成及图像感知任务,性能优于现有统一模型,在边缘检测等任务上甚至超过专有模型。
技术关键词
训练特征 图像分类模型 图像分割模型 编码器 融合特征 融合编码信息 注意力机制 多尺度特征 子模块 标签 语义 感知特征 分类特征 速度预测模型 卷积特征 边缘检测算子
系统为您推荐了相关专利信息
1
三维模型的生成方法、装置、设备以及存储介质
三维模型 三维网络结构 特征提取模块 视频 编码特征
2
基于深度互信息与变分编码器的遥感图像小样本分割方法
原型 最大化方法 样本 特征学习算法 图像全局特征
3
一种机器人关节模组及机器人
机器人关节模组 内齿圈 电机组件 绝缘挡板 穿线管
4
用于大语言模型问答的自适应多跳检索知识图谱构造方法
三元组 大语言模型 知识库实体 构建知识图谱 知识图谱构建
5
一种脑出血CT影像的智能图像处理方法和系统
智能图像处理方法 影像 Fisher准则 脑部CT图像 CT图像处理
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号