摘要
本发明提供一种模型训练方法、语音处理方法和装置,其中方法包括:将样本语音对中的提示语音对应的声学特征输入至语音特征提取模型,得到样本语音特征;将样本语音对中的目标语音,以及目标语音对应的样本文本和样本语音特征,输入至语音合成单元,得到合成语音;将目标语音,以及目标语音对应的样本文本和样本语音特征,输入至音色转换单元,得到音色转换语音;根据合成语音和/或音色转换语音,以及样本语音特征对应的声纹识别结果,对语音特征提取模型进行多任务联合训练,得到目标语音特征提取模型。本发明实现通过多任务约束优化训练语音特征提取模型,以有效提取更加丰富且鲁棒的说话人的语音特征。
技术关键词
语音特征提取
模型训练方法
语音处理单元
多任务联合训练
样本
声学特征
转换单元
文本
非暂态计算机可读存储介质
残差网络
模型训练装置
特征提取单元
标签
处理器
加载单元
存储器
系统为您推荐了相关专利信息
场景分类
图像分类网络
图像增强算法
站台雨棚
数据
参数优化设计方法
遗传算法优化
复合材料结构设计
分区
变量
机器学习模型
语音特征
共享设备
样本
说话人识别方法