情感语音合成方法、装置、计算机设备及可读存储介质

正文

推荐专利

申请号：CN202510014427

申请日期：2025-01-03

公开号：CN119741911B

公开日期：2025-09-30

类型：发明专利

摘要

本发明涉及人工智能及语音合成技术领域，公开了一种情感语音合成方法、装置、计算机设备及可读存储介质，包括：获取待进行语音合成的目标文本，识别所述目标文本的情感向量表示；对所述情感向量表示进行情感风格预测，得到情感风格权重；基于预训练的声学模型，确定所述目标文本的音素嵌入序列，以及控制所述声学模型采用所述情感风格权重对所述音素嵌入序列进行调整，以使所述声学模型利用调整后的所述音素嵌入序列生成所述目标文本的情感语音。即使在没有专业音频素材或情感标注的情况下，也能获得具有高度情感表达力的语音输出，提升了模型的泛化能力。

技术关键词

样本文本编码器训练语言模型风格语音序列适配器训练声学模型解码器情感类别计算机设备可读存储介质误差处理器声码器识别模块存储器

系统为您推荐了相关专利信息

一种智能运维知识库构建方法

运维知识库智能诊断模型梯度提升决策树关系网络实体

一种基于大语言模型的用户风险行为感知方法及相关设备

大语言模型风险社交媒体平台文本异常用户

一种钛合金显微组织检测方法及装置

组织检测方法钛合金深度学习模型电子背散射衍射样本

基于图信号卷积神经网络的工业互联网缺损数据估计方法

数据估计方法神经网络模型工业互联网技术样本节点特征

一种基于政务系统结构化及非结构化数据的清洗分析方法及系统

政务系统关键词分析方法索引指针

情感语音合成方法、装置、计算机设备及可读存储介质

站点导航

APP 下载