一种语音生成方法、装置、电子设备及可读存储介质

正文

推荐专利

申请号：CN202411133619

申请日期：2024-08-19

公开号：CN119028316A

公开日期：2024-11-26

类型：发明专利

摘要

本发明公开了一种语音生成方法、装置、电子设备及可读存储介质，属于人工智能技术领域，包括将文本文件输入语音生成模型；将文本转化为音素文件；提取每个音素的时间长度，并对各音素按文本文件文字内容顺序排列；判断每个音素前后是否需要插入音素间隔特征，所述音素间隔特征包括音素延长音或每个音素前后的空白音中的至少一种；判断每个音素前后是否需要插入语言习惯特征，所述语言习惯特征为整个文本文件语言环境中，每个音素前后的口癖习惯；根据的生成结果合成语音文件。在本发明的方案中，在音素级别特征合成语音前，判断每个音素前后是否需要插入音素延长音或空白音或口癖习惯，可以有效的确保生成语音的拟人程度，提升用户的使用体验。

技术关键词

语音生成方法间隔特征习惯语音生成模型统计学方法自然语言电子设备深度学习模型存储计算机程序人工智能技术生成语音图谱生成装置输入模块非标准可读存储介质文本频率

一种语音生成方法、装置、电子设备及可读存储介质

站点导航

APP 下载