摘要
本发明公开了一种音频声音事件检测方法、装置、可读存储介质及设备,属于音频检测技术领域,一种音频声音事件检测方法,包括:获取目标音频的第一音频特征图;将第一音频特征图输入基于十字交叉注意力机制预先训练好的声音事件检测模型中,确定目标音频的预测时间标签;根据目标音频的预测时间标签,确定目标音频中的特定声音事件。本发明通过十字交叉注意力机制能够有效建立不同时频点之间的联系,增强了特征表征能力,可准确识别声音事件中的细微变化和关键特征,解决了当前声音事件识别方法会导致短时声音事件的信息丢失,识别内容不完整的问题。
技术关键词
音频特征
声音事件检测方法
特征提取网络
事件检测模型
交叉注意力机制
标签
声音事件识别方法
门控循环单元
音频检测技术
事件检测装置
残差模块
可读存储介质
多尺度
条带
样本
计算机设备
通道