一种语音模型训练方法、语音合成方法及其相关装置

正文

推荐专利

申请号：CN202511057903

申请日期：2025-07-30

公开号：CN120726989A

公开日期：2025-09-30

类型：发明专利

摘要

本申请公开了一种语音模型训练方法、语音合成方法及其相关装置，训练方法包括：构建语音网络，语音网络包括第一网络分支和第二网络分支；以第一训练文本的拼音数据为输入数据，以第一训练文本的目标音频为训练目标训练第一网络分支；以参考音频的声学标记和第二训练文本为输入数据，以第二训练文本对应的目标音频为训练目标训练第二网络分支；加载训练好的第一网络分支、第二网络分支网络中各模块的网络参数到语音网络中，得到初始化后的语音网络；以声学标记、第二训练文本及其对应的拼音数据为输入数据，以第二训练文本的目标音频为训练目标训练初始化后的语音网络，得到训练好的语音模型。本申请提高了语音模型对多音字的发音准确率。

技术关键词

语音模型训练方法拼音音频声码器分支大语言模型网络文本标记注意力解码器发音序列数据解码模型训练装置参数存储程序代码特征提取单元

系统为您推荐了相关专利信息

视频生成方法、直播方法、装置、智能体及电子设备

标签视频生成方法直播方法文本大语言模型

一种基于声音混响的空调控制方法及空调器

空调控制方法混响时间房间保温音频

一种基于注意力机制的多模态身份验证方法

特征提取模型身份验证方法注意力机制融合特征指纹图像数据

对视频素材进行分类的系统、视频标签识别模型的训练方法

视频段音频编码模块样本标签

基于实测功率和风速协同同化的风功率智能预测方法和系统

数值天气预报数据智能预测方法风速注意力双向长短期记忆

一种语音模型训练方法、语音合成方法及其相关装置

站点导航

APP 下载