摘要
本发明公开了一种基于CLIP模型的编码‑解码开放词汇语义分割方法,本方法将传统的语义分割任务重新构建为区域识别问题,通过在冻结的CLIP模型基础上集成一个辅助网络,该网络包含两个主要功能模块:一是掩码预测模块,二是注意力偏置预测模块。所预测的注意力偏置有效地辅助CLIP模型识别掩码对应的类别。此设计显著提升了CLIP模型在掩码类别识别上的性能。此外,该辅助网络能够高效利用CLIP的特征,确保了网络的轻量化特性。整个系统支持端到端训练,进一步促进了辅助网络与CLIP模型的紧密融合和优化。此专利摘要概述了一种高效且实用的语义分割技术,具有广泛的应用潜力。
技术关键词
语义分割方法
注意力
图像分割模型
全局平均池化
网络
通道
标记
解码
视觉
编码
多层感知机
语义分割技术
预训练模型
融合策略
矩阵
语义特征
图片
偏差
功能模块
系统为您推荐了相关专利信息
智能合约执行
整流单元
节点特征
计算机程序指令
动态插桩技术
检测压铸件
预定算法
三维点云数据
二维图像数据
压铸件表面缺陷
电子飞行包
动态规划方法
实时数据
燃油
粒子群算法
数据压缩方法
卡尔曼滤波器
深度学习网络提取
深度学习特征提取
深度学习模型