摘要
本申请提供了一种语音生成方法、装置、计算机可读存储介质和电子设备,该方法包括:获取输入文本,其中,输入文本表示目标小语种的方言文本;通过有限状态转换模型将输入文本转换为标准文本;通过目标语音模型对标准文本进行分析,得到标准文本的音频特征,并根据音频特征生成目标语音,其中多组数据中的每组数据均包括历史标准文本和历史音频特征,历史标准文本包括通用文本和特殊文本,通用文本表示包括目标小语种在内的多种语种均包含的标准语言文本,特殊文本表示只有目标小语种所包含的标准语言文本。通过本申请,解决了无法准确将复杂的小语种的语言文字生成对应的语音的问题,达到准确生成小语种语言对应的语音的效果。
技术关键词
文本
语音生成方法
状态转换模型
音频特征
训练语音模型
机器学习训练
可读存储介质
字符
信号随时间
计算机
电子设备
生成语音
数据
波形
生成装置
转换单元
程序
存储器
系统为您推荐了相关专利信息
语音识别模型
编码特征
音频
编码器
语音识别方法
语义分割方法
注意力机制
图像编码器
双线性插值法
文本
智能问答方法
问答语料
人工智能模型
控件
内容管理
面向电网调度
检索方法
大语言模型
电网调度数据
知识检索系统