一种基于多特征建模和粒度感知的情感语音转换方法

正文

推荐专利

申请号：CN202410920631

申请日期：2024-07-10

公开号：CN118865938A

公开日期：2024-10-29

类型：发明专利

摘要

本发明公开了一种基于多特征建模和粒度感知的情感语音转换方法，包括：预训练阶段、微调阶段和转换阶段，其中预训练阶段和微调阶段用于有效实现情感语音语言内容和情感韵律的充分解纠缠，转换阶段则利用训练好的模型分别提取源情感语音的语言内容和目标情感语音的情感韵律以完成测试语料情感状态的转换。为了进一步地提高转换情感语音的情感饱和度，实现高表现力的情感转换效果，本发明还提出了多韵律特征建模和粒度感知的改进方法，分别从韵律特征的多样性和粒度感知性方面来优化韵律空间，从而能够挖掘出更多的韵律信息，有效提升了转换情感语音的情感饱和度。

技术关键词

情感语音转换方法频谱特征声学特征韵律特征连续小波变换分析文本编码器上下文特征情感分类器包络重构子模块模型预训练输入解码器序列阶段语句

一种基于多特征建模和粒度感知的情感语音转换方法

站点导航

APP 下载