一种基于特征解耦的语音情感转换方法

正文

推荐专利

一种基于特征解耦的语音情感转换方法

申请号：CN202411049706

申请日期：2024-08-01

公开号：CN118782060A

公开日期：2024-10-15

类型：发明专利

摘要

本发明提供一种基于特征解耦的语音情感转换方法，涉及人工智能技术领域。该方法包括：内容编码器从源语音中提取仅与语音内容相关的信息并删除与说话者相关的信息，传入神经网络模型中，提取内容相关信息特征；说话人编码器捕捉输入语音中的说话人身份信息；情感编码器包括基音模块和节奏模块用于提取说话人的基音特征和节奏特征；综合解码器将内容编码器、说话人编码器和情感编码器输出的特征信息结合起来，通过学习输入特征与目标输出之间的映射关系，生成具有目标说话人身份和情感风格的转换后语音。该方法充分考虑了影响语音情感表达的关键特征，通过捕捉和融合这些特征，使得转换后的语音呈现更加生动、自然且充满表现力的特质。

技术关键词

二维卷积神经网络一维卷积神经网络编码器转换方法特征提取网络说话人身份信息综合解码器节奏特征语音音频数据声学特征 ReLU函数上下文特征人工智能技术风格序列特征注意力

系统为您推荐了相关专利信息

一种基于能源大数据的区域碳排放模型构建方法和装置

模型构建装置数据库服务器应用服务器客户终端数据标签

一种功能安全电路监控系统

电路监控系统 GPR模型模拟多路复用器仲裁电路加权融合算法

一种高铁零部件裂纹实时检测方法

高铁零部件三维点云数据实时检测方法可见光图像多模态特征融合

基于MR多序列血管提取的颈动脉闭塞再通手术导航方法、设备及介质

手术导航方法血管分割三维磁共振序列全卷积神经网络

一种核磁共振图像伪影去除方法及系统

伪影数据 GAN模型自动编码器参数

一种基于特征解耦的语音情感转换方法

站点导航

APP 下载