语音合成方法及装置

正文

推荐专利

语音合成方法及装置

申请号：CN202411936289

申请日期：2024-12-26

公开号：CN119864008B

公开日期：2025-11-18

类型：发明专利

摘要

本发明提供一种语音合成方法及装置，所述方法包括：基于编码器中的当前自注意力模块，对上一自注意力模块输出的上一文本特征进行关键信息提取，确定当前文本特征；基于解码器中与当前自注意力模块层级对应的当前交叉注意力模块，对上一交叉注意力模块输出的上一语音特征与当前文本特征进行特征对齐，得到当前语音特征；基于解码器中末个交叉注意力模块输出的语音特征，对待合成文本进行语音合成，得到合成语音。本发明减少了语音合成中语义信息和声学信息的耦合，提高了语义信息和声学信息对齐稳定性，减少了交叉注意力带来的对齐不稳定，进而提高了语音合成效果。

技术关键词

语音特征注意力解码器文本模块层级编码器非暂态计算机可读存储介质处理器计算机程序产品语义存储器电子设备数据参数

系统为您推荐了相关专利信息

一种基于大语言模型的城市地铁客流量预测方法及系统

地铁客流量预测方法大语言模型多头注意力机制生成补丁序列

一种虚拟电厂协同控制智能调度系统及方法

智能调度系统评分预测模型发电设备电网运行数据储能设备

一种金融业务流程管理系统、方法、存储介质及电子设备

业务流程管理系统业务管理方法金融渠道 XGBoost模型

一种多肽的生物活性回归预测方法及装置

回归预测方法回归预测模型多肽长短期记忆网络元启发式算法

基于融合知识图谱和大语言模型的变压器故障诊断方法及系统

融合知识图谱实体关系抽取模型三元组大语言模型答案

语音合成方法及装置

站点导航

APP 下载