语音生成方法、装置、计算机可读存储介质和电子设备

正文

推荐专利

申请号：CN202510757993

申请日期：2025-06-06

公开号：CN120600001A

公开日期：2025-09-05

类型：发明专利

摘要

本申请提供了一种语音生成方法、装置、计算机可读存储介质和电子设备，该方法包括：获取输入文本，其中，输入文本表示目标小语种的方言文本；通过有限状态转换模型将输入文本转换为标准文本；通过目标语音模型对标准文本进行分析，得到标准文本的音频特征，并根据音频特征生成目标语音，其中多组数据中的每组数据均包括历史标准文本和历史音频特征，历史标准文本包括通用文本和特殊文本，通用文本表示包括目标小语种在内的多种语种均包含的标准语言文本，特殊文本表示只有目标小语种所包含的标准语言文本。通过本申请，解决了无法准确将复杂的小语种的语言文字生成对应的语音的问题，达到准确生成小语种语言对应的语音的效果。

技术关键词

文本语音生成方法状态转换模型音频特征训练语音模型机器学习训练可读存储介质字符信号随时间计算机电子设备生成语音数据波形生成装置转换单元程序存储器

系统为您推荐了相关专利信息

一种云计算中异常行为监测方法及系统

蜜罐物理虚拟机迁移检测线数据处理模块

语音识别方法、装置、电子设备、存储介质及产品

语音识别模型编码特征音频编码器语音识别方法

语义分割方法和相关产品

语义分割方法注意力机制图像编码器双线性插值法文本

智能问答方法、装置、电子设备及存储介质

智能问答方法问答语料人工智能模型控件内容管理

一种基于大语言模型的面向电网调度专业知识检索方法及系统

面向电网调度检索方法大语言模型电网调度数据知识检索系统

语音生成方法、装置、计算机可读存储介质和电子设备

站点导航

APP 下载