基于多模态数据融合的环境音事件检测方法

正文

推荐专利

基于多模态数据融合的环境音事件检测方法

申请号：CN202411562113

申请日期：2024-11-05

公开号：CN119446154A

公开日期：2025-02-14

类型：发明专利

摘要

本发明涉及环境音事件检测技术领域，具体涉及一种基于多模态数据融合的环境音事件检测方法，利用麦克风阵列、摄像头和传感器同步采集音频、视频及环境数据，形成多模态数据源。对采集到的多模态数据进行预处理，以提高数据质量和后续分析的准确性。从处理后的数据中提取关键特征，并将这些特征进行融合，形成多模态特征。构建深度学习模型，并使用多模态特征进行训练，以获得能够识别环境音事件的模型。将训练后的模型进行剪枝、量化和知识蒸馏等优化，部署在边缘设备上，实现实时的初步特征提取和事件检测。解决了现有技术中环境音事件检测方法存在的鲁棒性差、实时性不高以及泛化能力有限的问题。

技术关键词

事件检测方法多模态数据融合多模态特征深度学习模型短时傅里叶变换动态时间规整技术视觉SLAM技术多传感器融合技术音频高优先级事件事件检测技术麦克风阵列采集噪声抑制算法卷积神经网络提取生成视频数据深度卷积神经网络

系统为您推荐了相关专利信息

基于多源异构数据融合与深度学习的智能无线网络覆盖预测方法

多源异构数据融合覆盖预测方法智能无线网络栅格无线网络覆盖范围

多模态数据融合的电碳表碳排放监测方法及装置

多模态数据融合监测方法因子能源监测点

一种基于混合模型的指向性图像分割方法及系统

图像分割方法融合特征视觉特征多模态特征跨模态

智能招聘平台下的智能问答方法及系统

智能问答方法多模态特征融合实体识别模型校园平台

一种基于AI的投资项目可行性智能分析与决策支持系统

决策支持系统多模态数据融合动态知识图谱深度强化学习蒙特卡洛树搜索

基于多模态数据融合的环境音事件检测方法

站点导航

APP 下载