摘要
本申请公开了混合语音发音序列生成方法和模型训练方法、相关装置,该混合语音发音序列生成方法包括:基于原始音频信号进行发音预测,得到原始音频信号的预测发音序列,其中,原始音频信号为第一语种对应的音频信号,且携带有第二语种对应的目标词组,第一语种和第二语种为不同的语言;对预测发音序列进行分析,得到目标词组的实际发音序列;以及,生成包含目标词组的初始文本;利用目标词组的实际发音序列与初始文本,生成初始文本对应的混合语音发音序列。上述方案,能够提升多语种混合音频发音序列的质量。
技术关键词
序列生成方法
模型训练方法
语音
文本识别
音频特征
滤波器
发音特征
信号
样本
模块
处理器
可读存储介质
程序
指令
格式
存储器
系统为您推荐了相关专利信息
参数生成方法
人脸偏转角度
参数生成装置
情绪识别模型
电子设备
智能终端系统
数据储存模块
语音识别单元
语音采集模块
智能终端装置
识别车辆乘员
神经网络模型
梅尔频率倒谱系数
特征点
线性单元