用于训练音频处理模型的方法、装置、设备和存储介质

AITNT
正文
推荐专利
用于训练音频处理模型的方法、装置、设备和存储介质
申请号:CN202411814890
申请日期:2024-12-10
公开号:CN119649801A
公开日期:2025-03-18
类型:发明专利
摘要
根据本公开的实施例,提供了一种用于训练音频处理模型的方法、装置、设备和存储介质。该方法包括:获取训练数据集,训练数据集包括具有初始采样率的第一音频数据和具有目标采样率的第二音频数据;通过将噪声数据与第二音频数据基于一组预定参数进行阈值次数的加权叠加操作,确定阈值数量的第三音频数据,噪声数据与第一音频数据具有相同长度;通过将噪声数据输入音频处理模型来确定去噪后的第四音频数据;以及基于阈值数量的第三音频数据和第四音频数据之间的损失,调整音频处理模型的参数。由此,通过在训练过程中逐步添加噪声并去噪,能够高效地恢复音频的高频成分,并提高模型在不同音频数据上的稳定性和泛化能力。
技术关键词
噪声数据 音频 编码器模块 采样率 计算机可执行指令 处理单元 参数 计算机程序产品 解码器 计算机存储介质 传播算法 电子设备 可读存储介质 上采样 存储器 度量
系统为您推荐了相关专利信息
1
面向比特流的协议状态机推断方法及装置
协议状态机 推断方法 比特流 网络流量数据 会话
2
语音信息处理方法、系统及装置
语音信息处理方法 网关单元 语音识别单元 服务端 音频
3
一种交互式人工智能驱动的面部和语音分析方法和系统
面部图像数据 人工智能驱动 语音分析方法 车辆交互系统 车辆行驶状态
4
一种面向音符粒度的自动视唱音准评分方法及终端
评分方法 序列 音频 声学特征 动态时间规整算法
5
检测方法、检测系统及计算机可读存储介质
工业相机 图案 图像 定位点 可读存储介质
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号