摘要
本申请公开了基于说话人感知的语音增强训练方法、装置、设备及介质,涉及人工智能技术领域,包括:将第一带噪语音样本输入至初始语音增强联合训练系统,以便预训练语音增强模块对第一带噪语音样本进行去噪处理,输出第一增强语音样本,确定语音增强损失;通过预训练共享编码器提取第一增强语音样本的第一说话人敏感特征,通过预训练说话人识别模块对第一说话人敏感特征进行说话人ID分类,得到说话人ID分类预测结果,计算说话人识别损失;通过对抗训练鉴别器判断第一说话人敏感特征是否存在噪音,根据噪音判断结果调整对抗损失,以基于各损失更新系统参数,得到训练后的目标语音增强联合训练系统。协调语音增强与说话人识别两个任务之间冲突。
技术关键词
说话人识别
语音
训练系统
样本
编码器
训练鉴别器
多任务损失函数
标签
优化器
模型训练模块
存储计算机程序
参数
人工智能技术
更新系统
网络
训练装置
误差
可读存储介质
处理器
系统为您推荐了相关专利信息
融合词向量
文本
计算机程序指令
样本
计算机程序产品
喷氨控制方法
神经网络自适应控制
入口烟气温度
氨喷射系统
智能喷氨控制系统
智能决策引擎
算法模型
配置页面
风险控制方法
数据
电网故障处置
知识库管理系统
语句
知识图谱构建
生成图谱