一种语音合成方法、装置、电子设备及可读存储介质

AITNT
正文
推荐专利
一种语音合成方法、装置、电子设备及可读存储介质
申请号:CN202510593144
申请日期:2025-05-09
公开号:CN120108381A
公开日期:2025-06-06
类型:发明专利
摘要
本发明涉及语音合成技术领域,尤其涉及一种语音合成方法、装置、电子设备及可读存储介质,获取待合成语音的目标文本和一个随机采样噪声;将目标文本输入训练好的目标语音合成模型的文本特征提取模块,确定出目标文本的文本特征;目标语音合成模型还包括文本特征编码模块和语音生成模块;将文本特征和随机采样噪声输入文本特征编码模块,确定出文本特征对应的音频特征的潜在变量;将潜在变量输入语音生成模块,生成潜在变量对应的音频信号,并确定为与目标文本相匹配的目标合成语音。这样,通过训练好的语音合成模型,可以直接将目标文本的文本特征对应的音频特征的潜在变量转换为与目标文本相匹配的目标合成语音,提高了语音合成的合成效率。
技术关键词
文本 语音 音频特征 编码模块 特征提取模块 样本 变量 数据转换模块 音频编码 数据对齐模块 语义特征提取 机器可读指令 噪声 电子设备 矩阵 重构 时序
系统为您推荐了相关专利信息
1
一种视频数据处理方法及装置
预训练模型 视频数据处理方法 跨模态 时间段 样本
2
一种卫浴装修方案智能生成方法与装置
智能生成方法 室内空间 关键词提取模型 客户 文本
3
一种基于大语言模型的能源决策生成方法及系统
能源 大语言模型 决策生成方法 强化学习算法 数据
4
数据处理方法、平台、计算设备以及存储介质
邮件 数据处理方法 项目 客户端 订单
5
一种基于电磁波的异常电弧检测方法及系统
电弧检测方法 电弧检测模型 电弧检测系统 电磁波传感器 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号