基于稀疏滑动窗口的低时延生成音频检测连续学习方法、装置、设备及介质

正文

推荐专利

申请号：CN202410726655

申请日期：2024-06-06

公开号：CN118298799B

公开日期：2024-08-13

类型：发明专利

摘要

本发明提供了一种基于稀疏滑动窗口的低时延生成音频检测连续学习方法、装置、设备及介质，具体涉及音频检测技术领域，本发明实施例中，在对音频检测源模型进行训练的过程中，使用滑动池化窗口将模型第m层输出的隐藏状态分解为多个中间编码表示，并将所述多个中间编码表示组合为稀疏隐藏状态，将所述稀疏隐藏状态输入至第m+1层，这种时间稀疏机制能够显著减少GPU内存占用和计算时间，特别适用于大量数据的连续学习场景，如多数据集上的虚假音频检测任务，通过调整时间分辨率，时间稀疏机制可以在保持较高检测准确率的同时，大幅提高处理速度。

技术关键词

生成音频数据连续学习方法滑动窗口音频生成方法注意力机制时延参数音频检测技术传播算法学习装置处理器可读存储介质分辨率电子设备程序

基于稀疏滑动窗口的低时延生成音频检测连续学习方法、装置、设备及介质

站点导航

APP 下载