摘要
本发明属于轨道交通技术领域,公开了基于视觉模型的轨道交通环境异物侵入检测方法及系统。该方法首先通过预处理提取原始图像中的可疑区域子图,分别利用图像编码器提取粗粒度全局特征向量及细粒度局部特征向量;同时生成与图像内容匹配的文本提示信息,提取对应的文本特征向量;通过计算图像特征向量与文本特征向量的多层次相似度,结合各自的权重融合得到综合异常分数;最后基于混合高斯模型动态建模异常分数分布,实现异物侵入判定。本发明融合图像与文本多模态信息,通过多尺度特征关联提升复杂场景下异物的检测精度,采用自适应阈值策略增强动态环境适应性,有效解决了传统方法在铁路复杂背景中误检率高、泛化能力不足的问题。
技术关键词
文本特征向量
图像编码器
图像特征向量
异物侵入检测方法
轨道交通环境
文本编码器
混合高斯模型
多层次
车载摄像头
侵入检测系统
网络深度
期望最大化算法
分层特征提取
协方差矩阵
高速铁路
图像分割模型
轨道交通技术
无监督
系统为您推荐了相关专利信息
隧道衬砌病害检测
训练深度学习模型
注意力机制
表达式
数据
标注方法
标注系统
图像分割模型
图像特征向量
图像编码器
图像特征向量
大语言模型
图像特征编码
文本特征向量
交叉注意力机制
依存句法树
视频检索方法
文本特征向量
视频特征向量
预训练模型