一种基于扩散模型的开放词汇语义分割方法

AITNT
正文
推荐专利
一种基于扩散模型的开放词汇语义分割方法
申请号:CN202511082948
申请日期:2025-08-04
公开号:CN120953614A
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开了一种基于扩散模型的开放词汇语义分割方法,包括以下步骤:根据输入图像,融合图像的全局语义和局部语义,并自动提取图像中的目标类别集合和文本提示;针对每个目标类别,基于末尾填充符嵌入调整策略和目标类别嵌入增强方法,对目标类别和文本提示进行处理,获得优化后的文本嵌入;针对每个目标类别,根据优化后的文本嵌入,扩散模型通过层级式注意力融合,得到目标类别激活图;对每个目标类别激活图进行后处理,融合生成最终的语义分割结果。本发明提出的方法,可以根据输入的图像产生高精度的分割掩码;其次,由于其开放词汇的特性,模型可以提取出图像中的任意类别并产生对应的分割结果。
技术关键词
注意力 文本编码器 语义分割方法 图像 层级 条件随机场 语义特征 分辨率 自然语言 视觉 计算机装置 策略 计算机程序产品 处理器 像素 可读存储介质 网络 存储器
系统为您推荐了相关专利信息
1
基于选举的一次多票识别系统的选举机
识别系统 数据处理模块 图像采集模块 身份验证模块 CCD相机
2
一种基于多模态感知的玻璃清洁和分拣系统
分拣系统 红外热像仪 多模态 图像处理器 玻璃传输系统
3
人流量空间分布预测方法及区域公共安全预警方法
空间分布预测方法 公共安全预警方法 网格 注意力机制 深度神经网络
4
一种用于农业数据处理的智能实验室管理方法
智能实验室管理 图像增强模型 初始聚类中心 信息管理系统 农作物病害
5
一种基于CYP2D6基因与环境因素的帕利哌酮代谢效率评估系统
效率评估系统 基因 分析单元 数据 多模态特征融合
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号