摘要
一种基于多粒度对比学习的红外视频语义分割方法,属于红外图像处理技术领域。为解决实现不增加推理时间的情况下提升了语义分割精度的问题。本发明包括将红外视频进行时序一致空间增强变换处理,得到标注帧、两个有重叠部分的子视频片段构建多粒度对比学习框架,包括在分类层之前加入三个并行的多层感知机MLP构成上下文投影层、时序投影层、类别投影层;在标注帧标签监督的基础上从不同粒度构建对比学习自监督损失函数,包括上下文泛化性损失函数、视频内时序一致性损失函数、跨视频类别区分性损失函数。基于困难锚点采样策略构建训练集;得到训练好的基于多粒度对比学习的红外视频语义分割模型,用于红外视频语义分割。
技术关键词
视频语义分割方法
样本
语义分割模型
时序
锚点
多层感知机
视频帧特征
表达式
红外图像处理技术
构建训练集
存储单元
标签
像素
度函数
更新模型参数
优化器
超参数
系统为您推荐了相关专利信息
知识传递方法
知识推理方法
信息处理单元
参数
自然语言文本
MLP神经网络
估算系统
数据处理模块
样本
矿物探测技术
轻量化方法
残差神经网络
样本
滤波器
双线性插值方法
稠密卷积神经网络
数值天气预报模式
气象
参数化方法
云微物理