基于多阶局部和全局融合网络的声音事件定位与检测方法

AITNT
正文
推荐专利
基于多阶局部和全局融合网络的声音事件定位与检测方法
申请号:CN202410747471
申请日期:2024-06-11
公开号:CN118692493A
公开日期:2024-09-24
类型:发明专利
摘要
一种基于多阶局部和全局融合网络的声音事件定位与检测方法,由数据集预处理、特征提取、构建多阶局部和全局融合网络、训练多阶局部和全局融合网络、测试多阶局部和全局融合网络、定位和检测声音事件步骤组成。本发明采用了多阶局部和全局融合网络,提取空间多阶特征信息的同时,使用局部卷积块提取局部特征信息,使用全局Transformer块捕获上下文特征信息,并根据局部特征和上下文特征的重要性进行自适应地融合,增强了特征的多样性,提高了特征的表达能力,克服了卷积循环神经网络提取特征不充分的问题。本发明具有识别准确率高、定位误差小、提取特征信息完整等优点,可用于声音事件定位与检测。
技术关键词
注意力 分支 线性单元 动态 矢量特征 积层 多尺度 度函数 频谱特征 卷积循环神经网络 上下文特征 Softmax函数 笛卡尔 局部特征信息 短时傅里叶变换 门控循环单元 全局平均池化 级联 声音类别
系统为您推荐了相关专利信息
1
一种模型训练方法、装置、电子设备和存储介质
训练特征 教师 学生 动态令牌 注意力
2
一种基于聚合像素特征提取的图像去雾方法
图像去雾模型 图像去雾方法 模块 分支 注意力
3
一种新能源发电设备的故障诊断方法及系统
新能源发电设备 网络拓扑结构 故障诊断方法 动态数据集 偏差
4
一种基于人机协同的中文网络暴力事件数据集构建方法
数据集构建方法 人机协同 标签 大语言模型 社交媒体平台
5
基于数字孪生模型的车型敏捷推荐方法及系统
乘用车 车型 数字孪生模型 推荐方法 模型库
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号