一种基于子带损失函数的语音增强模型训练方法、系统、终端及介质

AITNT
正文
推荐专利
一种基于子带损失函数的语音增强模型训练方法、系统、终端及介质
申请号:CN202511569249
申请日期:2025-10-30
公开号:CN121034333A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于子带损失函数的语音增强模型训练方法、系统、终端及介质,涉及语音增强技术领域,方法包括:获取带噪语音和干净语音,并分别确定增强语音对数功率谱以及目标语音对数功率谱;基于梅尔尺度,分别对增强语音对数功率谱与目标语音对数功率谱进行分割,得到增强语音子带与目标语音子带;确定每个增强语音子带与对应的目标语音子带之间的子带损失值;为每个子带损失值分配感知权重,并确定总体损失值并值引导语音增强模型训练。本发明能引导语音增强模型针对不同频率展现差异化的学习行为,从而让语音增强模型输出更贴合人类听觉感知规律的语音,显著提升语音增强后的听感舒适度。
技术关键词
语音 模型训练方法 功率 频率转换 模型训练系统 可读存储介质 索引 听觉 终端 程序 计算机 处理器 人类 模块 存储器 舒适度 曲线 误差
系统为您推荐了相关专利信息
1
一种基于多模态大模型和认知行为疗法的智能心理咨询系统
心理咨询系统 面部图像数据 多模态 情绪状态信息 面部关键点
2
一种两轮车用智能后视镜导航指示系统
导航指示系统 车用智能后视镜 LED灯组 车载导航设备 闪烁频率
3
一种语音控制信息的采集装置及烟叶烤房控制系统
音量传感器 主控单元 语音 烟叶烤房 时间段
4
一种语音识别纠错方法及相关设备
语音识别纠错方法 大语言模型 语音特征提取 生成帧 计算机程序产品
5
具身智能体的任务执行方法
傅里叶变换处理 多模态 数据 语音提示信息 周期
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号