基于视听融合的道路场景识别方法及系统

AITNT
正文
推荐专利
基于视听融合的道路场景识别方法及系统
申请号:CN202410992437
申请日期:2024-07-23
公开号:CN118965103A
公开日期:2024-11-15
类型:发明专利
摘要
本发明提出了基于视听融合的道路场景识别方法及系统,涉及道路场景识别技术领域。包括获取道路场景视频,提取关键帧;提取关键帧中每一帧的全局特征和局部特征进行融合,得到多层的关键帧的场景特征表示,将多层的关键帧的场景特征表示进行融合,得到道路场景视觉模态的视觉特征;分离道路场景视频中的音频,提取音频的MFCC特征,作为道路场景音频模态的声音特征;将视觉特征和声音特征进行融合,基于融合特征对道路场景进行分类,得到道路场景识别结果。本发明充分考虑道路视频场景的局部目标特征与全局场景特征的结合,并考虑将视觉特征与声音特征进行多模态融合,通过多层视听融合的框架,提高道路视频场景识别的准确率。
技术关键词
道路场景识别方法 关键帧 场景特征 视听 融合特征 音频 视频场景识别 场景识别技术 场景识别系统 声音特征提取 视觉特征提取 图像特征提取 处理器 程序 可读存储介质 多模态
系统为您推荐了相关专利信息
1
一种自适应权重多模态融合的生物特征智能分类预测方法
智能分类预测 稳定特征 冗余度 下降斜率 多模态生物特征
2
一种适应动态环境的道路监测多模态感知方法及其系统
数据传输延迟 多层感知器网络 动态反馈机制 融合策略 多模态感知系统
3
多模态数据驱动的护理员培训方法、装置、设备及介质
时空融合特征 虚拟现实培训 时序神经网络 肘关节 多模态
4
基于对比学习的多模态虚假新闻监测方法
关键帧 监测方法 文本 模态特征 关键词
5
一种复杂云况背景下的光学遥感图像船舶检测方法
注意力机制 全局特征提取 特征融合网络 特征提取网络 双向注意力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号