基于视听融合的道路场景识别方法及系统

正文

推荐专利

基于视听融合的道路场景识别方法及系统

申请号：CN202410992437

申请日期：2024-07-23

公开号：CN118965103A

公开日期：2024-11-15

类型：发明专利

摘要

本发明提出了基于视听融合的道路场景识别方法及系统，涉及道路场景识别技术领域。包括获取道路场景视频，提取关键帧；提取关键帧中每一帧的全局特征和局部特征进行融合，得到多层的关键帧的场景特征表示，将多层的关键帧的场景特征表示进行融合，得到道路场景视觉模态的视觉特征；分离道路场景视频中的音频，提取音频的MFCC特征，作为道路场景音频模态的声音特征；将视觉特征和声音特征进行融合，基于融合特征对道路场景进行分类，得到道路场景识别结果。本发明充分考虑道路视频场景的局部目标特征与全局场景特征的结合，并考虑将视觉特征与声音特征进行多模态融合，通过多层视听融合的框架，提高道路视频场景识别的准确率。

技术关键词

道路场景识别方法关键帧场景特征视听融合特征音频视频场景识别场景识别技术场景识别系统声音特征提取视觉特征提取图像特征提取处理器程序可读存储介质多模态

系统为您推荐了相关专利信息

一种自适应权重多模态融合的生物特征智能分类预测方法

智能分类预测稳定特征冗余度下降斜率多模态生物特征

一种适应动态环境的道路监测多模态感知方法及其系统

数据传输延迟多层感知器网络动态反馈机制融合策略多模态感知系统

多模态数据驱动的护理员培训方法、装置、设备及介质

时空融合特征虚拟现实培训时序神经网络肘关节多模态

基于对比学习的多模态虚假新闻监测方法

关键帧监测方法文本模态特征关键词

一种复杂云况背景下的光学遥感图像船舶检测方法

注意力机制全局特征提取特征融合网络特征提取网络双向注意力

基于视听融合的道路场景识别方法及系统

站点导航

APP 下载