摘要
本发明公开了一种基于扩散模型的开放词汇语义分割方法,包括以下步骤:根据输入图像,融合图像的全局语义和局部语义,并自动提取图像中的目标类别集合和文本提示;针对每个目标类别,基于末尾填充符嵌入调整策略和目标类别嵌入增强方法,对目标类别和文本提示进行处理,获得优化后的文本嵌入;针对每个目标类别,根据优化后的文本嵌入,扩散模型通过层级式注意力融合,得到目标类别激活图;对每个目标类别激活图进行后处理,融合生成最终的语义分割结果。本发明提出的方法,可以根据输入的图像产生高精度的分割掩码;其次,由于其开放词汇的特性,模型可以提取出图像中的任意类别并产生对应的分割结果。
技术关键词
注意力
文本编码器
语义分割方法
图像
层级
条件随机场
语义特征
分辨率
自然语言
视觉
计算机装置
策略
计算机程序产品
处理器
像素
可读存储介质
网络
存储器
系统为您推荐了相关专利信息
识别系统
数据处理模块
图像采集模块
身份验证模块
CCD相机
分拣系统
红外热像仪
多模态
图像处理器
玻璃传输系统
空间分布预测方法
公共安全预警方法
网格
注意力机制
深度神经网络
智能实验室管理
图像增强模型
初始聚类中心
信息管理系统
农作物病害
效率评估系统
基因
分析单元
数据
多模态特征融合