基于多模态数据融合的环境音事件检测方法

AITNT
正文
推荐专利
基于多模态数据融合的环境音事件检测方法
申请号:CN202411562113
申请日期:2024-11-05
公开号:CN119446154A
公开日期:2025-02-14
类型:发明专利
摘要
本发明涉及环境音事件检测技术领域,具体涉及一种基于多模态数据融合的环境音事件检测方法,利用麦克风阵列、摄像头和传感器同步采集音频、视频及环境数据,形成多模态数据源。对采集到的多模态数据进行预处理,以提高数据质量和后续分析的准确性。从处理后的数据中提取关键特征,并将这些特征进行融合,形成多模态特征。构建深度学习模型,并使用多模态特征进行训练,以获得能够识别环境音事件的模型。将训练后的模型进行剪枝、量化和知识蒸馏等优化,部署在边缘设备上,实现实时的初步特征提取和事件检测。解决了现有技术中环境音事件检测方法存在的鲁棒性差、实时性不高以及泛化能力有限的问题。
技术关键词
事件检测方法 多模态数据融合 多模态特征 深度学习模型 短时傅里叶变换 动态时间规整技术 视觉SLAM技术 多传感器融合技术 音频 高优先级事件 事件检测技术 麦克风阵列采集 噪声抑制算法 卷积神经网络提取 生成视频数据 深度卷积神经网络
系统为您推荐了相关专利信息
1
基于多源异构数据融合与深度学习的智能无线网络覆盖预测方法
多源异构数据融合 覆盖预测方法 智能无线网络 栅格 无线网络覆盖范围
2
多模态数据融合的电碳表碳排放监测方法及装置
多模态数据融合 监测方法 因子 能源 监测点
3
一种基于混合模型的指向性图像分割方法及系统
图像分割方法 融合特征 视觉特征 多模态特征 跨模态
4
智能招聘平台下的智能问答方法及系统
智能问答方法 多模态特征融合 实体识别模型 校园 平台
5
一种基于AI的投资项目可行性智能分析与决策支持系统
决策支持系统 多模态数据融合 动态知识图谱 深度强化学习 蒙特卡洛树搜索
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号