基于稀疏滑动窗口的低时延生成音频检测连续学习方法、装置、设备及介质

AITNT
正文
推荐专利
基于稀疏滑动窗口的低时延生成音频检测连续学习方法、装置、设备及介质
申请号:CN202410726655
申请日期:2024-06-06
公开号:CN118298799B
公开日期:2024-08-13
类型:发明专利
摘要
本发明提供了一种基于稀疏滑动窗口的低时延生成音频检测连续学习方法、装置、设备及介质,具体涉及音频检测技术领域,本发明实施例中,在对音频检测源模型进行训练的过程中,使用滑动池化窗口将模型第m层输出的隐藏状态分解为多个中间编码表示,并将所述多个中间编码表示组合为稀疏隐藏状态,将所述稀疏隐藏状态输入至第m+1层,这种时间稀疏机制能够显著减少GPU内存占用和计算时间,特别适用于大量数据的连续学习场景,如多数据集上的虚假音频检测任务,通过调整时间分辨率,时间稀疏机制可以在保持较高检测准确率的同时,大幅提高处理速度。
技术关键词
生成音频数据 连续学习方法 滑动窗口 音频生成方法 注意力机制 时延 参数 音频检测技术 传播算法 学习装置 处理器 可读存储介质 分辨率 电子设备 程序
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号