一种基于扩散模型的开放词汇语义分割方法

正文

推荐专利

一种基于扩散模型的开放词汇语义分割方法

申请号：CN202511082948

申请日期：2025-08-04

公开号：CN120953614A

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开了一种基于扩散模型的开放词汇语义分割方法，包括以下步骤：根据输入图像，融合图像的全局语义和局部语义，并自动提取图像中的目标类别集合和文本提示；针对每个目标类别，基于末尾填充符嵌入调整策略和目标类别嵌入增强方法，对目标类别和文本提示进行处理，获得优化后的文本嵌入；针对每个目标类别，根据优化后的文本嵌入，扩散模型通过层级式注意力融合，得到目标类别激活图；对每个目标类别激活图进行后处理，融合生成最终的语义分割结果。本发明提出的方法，可以根据输入的图像产生高精度的分割掩码；其次，由于其开放词汇的特性，模型可以提取出图像中的任意类别并产生对应的分割结果。

技术关键词

注意力文本编码器语义分割方法图像层级条件随机场语义特征分辨率自然语言视觉计算机装置策略计算机程序产品处理器像素可读存储介质网络存储器

系统为您推荐了相关专利信息

基于选举的一次多票识别系统的选举机

识别系统数据处理模块图像采集模块身份验证模块 CCD相机

一种基于多模态感知的玻璃清洁和分拣系统

分拣系统红外热像仪多模态图像处理器玻璃传输系统

人流量空间分布预测方法及区域公共安全预警方法

空间分布预测方法公共安全预警方法网格注意力机制深度神经网络

一种用于农业数据处理的智能实验室管理方法

智能实验室管理图像增强模型初始聚类中心信息管理系统农作物病害

一种基于CYP2D6基因与环境因素的帕利哌酮代谢效率评估系统

效率评估系统基因分析单元数据多模态特征融合

一种基于扩散模型的开放词汇语义分割方法

站点导航

APP 下载