摘要
本发明提供一种基于图文多模态的道路灾害检测与分层识别方法,涉及智能交通监测技术领域,方法包括:构建分层文本描述集合,第一层用于交通场景分类并排除非交通干扰画面,第二层用于道路灾害分类且包含负样本提示词;通过文本编码器离线生成文本特征向量并存储至向量数据库;将多模态大模型视觉模块拆分为独立视觉编码器,经ONNX转换部署至边缘设备;实时获取交通图像关键帧,通过视觉编码器提取特征向量,先与第一层文本特征进行余弦相似度匹配,通过筛选后与第二层灾害特征匹配,经softmax归一化和Argmax排序输出分类结果。本发明通过分层语义过滤解决复杂场景识别率低问题,利用模型轻量化拆分实现边缘部署,结合负样本设计提升异常环境下的判别鲁棒性。
技术关键词
分层识别方法
文本特征向量
多模态
图文
图像特征向量
智能交通监测技术
文本编码器
场景分类
关键帧
夜间灯光
火灾场景
视觉
样本
画面
格式
系统为您推荐了相关专利信息
动态估计方法
导频信号配置
优化信道估计
轻量级神经网络
系统资源利用率
深度神经网络模型
裂纹扩展速率
材料设备
深度特征学习
应力场
双腔气管导管
多模态数据融合
气管插管
Siamese网络
图片