语音生成方法、装置、计算机可读存储介质和电子设备

AITNT
正文
推荐专利
语音生成方法、装置、计算机可读存储介质和电子设备
申请号:CN202510757993
申请日期:2025-06-06
公开号:CN120600001A
公开日期:2025-09-05
类型:发明专利
摘要
本申请提供了一种语音生成方法、装置、计算机可读存储介质和电子设备,该方法包括:获取输入文本,其中,输入文本表示目标小语种的方言文本;通过有限状态转换模型将输入文本转换为标准文本;通过目标语音模型对标准文本进行分析,得到标准文本的音频特征,并根据音频特征生成目标语音,其中多组数据中的每组数据均包括历史标准文本和历史音频特征,历史标准文本包括通用文本和特殊文本,通用文本表示包括目标小语种在内的多种语种均包含的标准语言文本,特殊文本表示只有目标小语种所包含的标准语言文本。通过本申请,解决了无法准确将复杂的小语种的语言文字生成对应的语音的问题,达到准确生成小语种语言对应的语音的效果。
技术关键词
文本 语音生成方法 状态转换模型 音频特征 训练语音模型 机器学习训练 可读存储介质 字符 信号随时间 计算机 电子设备 生成语音 数据 波形 生成装置 转换单元 程序 存储器
系统为您推荐了相关专利信息
1
一种云计算中异常行为监测方法及系统
蜜罐 物理 虚拟机迁移 检测线 数据处理模块
2
语音识别方法、装置、电子设备、存储介质及产品
语音识别模型 编码特征 音频 编码器 语音识别方法
3
语义分割方法和相关产品
语义分割方法 注意力机制 图像编码器 双线性插值法 文本
4
智能问答方法、装置、电子设备及存储介质
智能问答方法 问答语料 人工智能模型 控件 内容管理
5
一种基于大语言模型的面向电网调度专业知识检索方法及系统
面向电网调度 检索方法 大语言模型 电网调度数据 知识检索系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号