摘要
本发明公开了一种基于子带损失函数的语音增强模型训练方法、系统、终端及介质,涉及语音增强技术领域,方法包括:获取带噪语音和干净语音,并分别确定增强语音对数功率谱以及目标语音对数功率谱;基于梅尔尺度,分别对增强语音对数功率谱与目标语音对数功率谱进行分割,得到增强语音子带与目标语音子带;确定每个增强语音子带与对应的目标语音子带之间的子带损失值;为每个子带损失值分配感知权重,并确定总体损失值并值引导语音增强模型训练。本发明能引导语音增强模型针对不同频率展现差异化的学习行为,从而让语音增强模型输出更贴合人类听觉感知规律的语音,显著提升语音增强后的听感舒适度。
技术关键词
语音
模型训练方法
功率
频率转换
模型训练系统
可读存储介质
索引
听觉
终端
程序
计算机
处理器
人类
模块
存储器
舒适度
曲线
误差
系统为您推荐了相关专利信息
心理咨询系统
面部图像数据
多模态
情绪状态信息
面部关键点
导航指示系统
车用智能后视镜
LED灯组
车载导航设备
闪烁频率
语音识别纠错方法
大语言模型
语音特征提取
生成帧
计算机程序产品