一种基于模态信息评价的道路场景识别方法及系统

AITNT
正文
推荐专利
一种基于模态信息评价的道路场景识别方法及系统
申请号:CN202510503972
申请日期:2025-04-22
公开号:CN120408372A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开了一种基于模态信息评价的道路场景识别方法及系统,属于道路场景识别技术领域,包括:基于提取的多模态特征,构建基于模态信息评价的场景识别多任务模型;多模态特征包括音频特征和视频图像帧特征;场景识别多任务模型包括协同网络和主干分类网络,协同网络由视觉特征提取VGG16‑places365作为模态质量评价网络,并使用基于局部归一化亮度系数的BRISQUE算法作为教师模型为模态质量评价网络提供学习参考标签;主干分类网络使用多模态DBN网络对视觉与音频两种模态场景信息进行无监督联合表示。本发明将图像质量与亮度信息联系起来,提出模态信息质量评价因子来评估视频图像帧质量,从而可动态的根据照度变化调整模态信息权重,达到识别模型鲁棒的目的。
技术关键词
道路场景识别方法 分类网络 视频 DBN模型 音频特征 视觉特征提取 Softmax分类器 多模态信息 多模态特征 评价特征 场景识别技术 场景识别系统 概率生成模型 图像 跨模态 无监督 随机梯度下降
系统为您推荐了相关专利信息
1
一种视频剪辑方法、设备、介质和程序产品
关键帧 视频剪辑方法 锚点 样本 视频流
2
用于燃气场站的视觉报警系统及报警方法、存储介质
视觉报警系统 人工智能模型 数据存储子系统 报警方法 图像分析
3
一种基于视觉的设备健康度量化检测方法
化检测方法 协方差矩阵 静态特征 度量 动态
4
变电站目标检测方法、装置、电子设备和存储介质
变电站巡检 注意力机制 上下文特征 巡检机器人 变电站机器人巡检
5
基于多端协同的赛事数据处理方法及系统
计分系统 赛事数据处理方法 直播终端 实时视频流 挂件
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号