摘要
本发明涉及语音信号处理技术领域,具体涉及一种基于风格向量调控的高保真语音风格迁移方法,包括:获取待处理的原始语音信号,对语音信号进行数据预处理,得到待输入语音特征表示;构建并训练神经网络,得到训练好的端到端神经网络模型,作为风格迁移神经网络模型;所述风格迁移神经网络模型包括内容编码器、风格编码器、风格调控模块和解码器;将待输入语音特征表示输入到风格迁移神经网络模型中,得到高保真语音波形。本发明通过结合端到端神经网络和风格向量的精细化调控机制,实现高保真、稳定且可控的语音风格迁移。
技术关键词
语音风格迁移方法
神经网络模型
语音特征
编码器
解耦机制
损失函数设计
辅助分类器
解码器
训练神经网络
语音信号处理技术
调控单元
短时傅里叶变换
注意力机制
波形
自然语言
模板
系统为您推荐了相关专利信息
多模态深度神经网络
分类规则
数据分析模型
非暂态计算机可读存储介质
实时数据
关节角度预测方法
数据
坐标系
矩阵
三维动作捕捉系统