摘要
本发明公开了一种面向轨道交通工程视频图像的空域自监督学习方法及系统,方法包括:完成视频图像预处理;将图像分块后以预设步长和窗口大小生成空间缩减窗口集合SRW,对各窗口中图块进行混合采用并记录掩码位置;从采样后的图块中抽取预设比例图块随机添加退化特征;采用含图块切分、线性嵌入、多尺度特征融合等模块的多尺度滑动变换器为编码器,通过多尺度特征融合模块将模型多尺度的特征提取问题转为在不同深度的通道特征自注意力融合问题实现多尺度特征提取,经像素重组和MAE解码器恢复分辨率并重建图像,结合重建损失和跨图块损失,用随机梯度下降优化器完成训练。让模型在无额外监督的情况下学习到潜在的安全隐患特征。
技术关键词
面向轨道交通
监督学习方法
多尺度特征融合
图像
输出特征
退化特征
多尺度特征提取
注意力
视频
随机梯度下降
模拟真实场景
分块
通道
像素
阶段
模块
分辨率
融合多尺度信息
解码结构
预训练模型
系统为您推荐了相关专利信息
图像特征向量
图像生成方法
图像分类方法
生成对抗网络架构
分类器
巡检路径
巡检机器人
三维栅格地图
光伏组件故障
采样点