语音生成方法、装置、设备及介质

正文

推荐专利

语音生成方法、装置、设备及介质

申请号：CN202510366622

申请日期：2025-03-26

公开号：CN120148474A

公开日期：2025-06-13

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于医疗健康、金融科技等业务场景，公开了一种语音生成方法，包括：构建多语言语音合成模型，获取纯文本数据及配对语音文本数据，构建扩展词汇表；更新语言感知嵌入层和模型参数，将输入文本转换为标记序列；编码器提取上下文语义特征，提取发音规则特征，解码器融合特征生成声学特征序列，并转换为目标语音数据。本发明通过多语言语音合成模型结合语言感知嵌入层，提高低资源语言的语音生成能力；扩展词汇表提升文本转换准确性，无监督训练增强目标语言学习能力，监督训练优化低数据环境适应性，特征融合提升语音自然度和流畅性。

技术关键词

语音生成方法声学特征语义特征文本解码器字符编码器生成程序序列符号多语言发音标记融合特征数据特征提取模块交叉注意力机制模型更新低资源语言

系统为您推荐了相关专利信息

应急交通疏散路径规划方法及系统

疏散路径规划声音分类器交通模板匹配算法路径规划系统

基于相位感知平行注意力机制的无监督风电设备叶片故障检测方法

风电设备叶片故障检测方法注意力机制辅助编码器故障检测模型

一种个性化情感交互方法、系统、电子设备及可存储介质

情感交互方法记忆异步控制意图分类模型实体识别模型

一种基于融合视觉特征的RGB-D快速无监督配准方法

融合视觉特征融合特征配准方法点云无监督

一种记忆增强型艺术家智能体自主学习与创作系统及方法

艺术家创作方法深度学习算法智能体系统原创性

语音生成方法、装置、设备及介质

站点导航

APP 下载