摘要
本发明提供了一种基于稀疏滑动窗口的低时延生成音频检测连续学习方法、装置、设备及介质,具体涉及音频检测技术领域,本发明实施例中,在对音频检测源模型进行训练的过程中,使用滑动池化窗口将模型第m层输出的隐藏状态分解为多个中间编码表示,并将所述多个中间编码表示组合为稀疏隐藏状态,将所述稀疏隐藏状态输入至第m+1层,这种时间稀疏机制能够显著减少GPU内存占用和计算时间,特别适用于大量数据的连续学习场景,如多数据集上的虚假音频检测任务,通过调整时间分辨率,时间稀疏机制可以在保持较高检测准确率的同时,大幅提高处理速度。
技术关键词
生成音频数据
连续学习方法
滑动窗口
音频生成方法
注意力机制
时延
参数
音频检测技术
传播算法
学习装置
处理器
可读存储介质
分辨率
电子设备
程序