一种基于图文多模态的道路灾害检测与分层识别方法

AITNT
正文
推荐专利
一种基于图文多模态的道路灾害检测与分层识别方法
申请号:CN202511056410
申请日期:2025-07-30
公开号:CN120953935A
公开日期:2025-11-14
类型:发明专利
摘要
本发明提供一种基于图文多模态的道路灾害检测与分层识别方法,涉及智能交通监测技术领域,方法包括:构建分层文本描述集合,第一层用于交通场景分类并排除非交通干扰画面,第二层用于道路灾害分类且包含负样本提示词;通过文本编码器离线生成文本特征向量并存储至向量数据库;将多模态大模型视觉模块拆分为独立视觉编码器,经ONNX转换部署至边缘设备;实时获取交通图像关键帧,通过视觉编码器提取特征向量,先与第一层文本特征进行余弦相似度匹配,通过筛选后与第二层灾害特征匹配,经softmax归一化和Argmax排序输出分类结果。本发明通过分层语义过滤解决复杂场景识别率低问题,利用模型轻量化拆分实现边缘部署,结合负样本设计提升异常环境下的判别鲁棒性。
技术关键词
分层识别方法 文本特征向量 多模态 图文 图像特征向量 智能交通监测技术 文本编码器 场景分类 关键帧 夜间灯光 火灾场景 视觉 样本 画面 格式
系统为您推荐了相关专利信息
1
大数据适配分析的物流工单管理方法、系统及介质
工单管理方法 物流箱 多模态数据采集 序列 容积
2
基于多模态信号处理的无线接入网导频传输优化与信道参数动态估计方法和系统
动态估计方法 导频信号配置 优化信道估计 轻量级神经网络 系统资源利用率
3
高温环境下硅基新材料设备裂纹扩展在线监测方法及系统
深度神经网络模型 裂纹扩展速率 材料设备 深度特征学习 应力场
4
一种基于多模态数据融合的双腔气管导管选择方法及系统
双腔气管导管 多模态数据融合 气管插管 Siamese网络 图片
5
一种多模态视频数据与文本数据混合融合方法及系统
融合方法 多路径特征融合 视觉特征 文本 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号