摘要
本发明公开一种基于参数动态调整的生成对抗网络语音转换方法,在特征提取阶段,提取语音的基频、频谱包络及非周期性特征。训练时,对特征张量进行批量归一化和自注意力处理,再经卷积、Sigmoid激活及Dropout正则化得到gamma调整参数。随后,通过自适应池化和卷积生成动态gamma值,强化频谱特征间的相关性,提升语音质量。在转换阶段,使用训练模型结合声码器合成目标语音。本方案利用频谱包络与动态gamma值,增强特征间长距离依赖,提高语音转换性能。
技术关键词
语音转换方法
生成对抗网络
正则化技术
动态
参数
注意力机制
元素
输出特征
频谱包络信息
语音转换系统
语音特征提取
采样模块
多通道特征
模型训练模块
批量
数据
系统为您推荐了相关专利信息
脑网络结构
网络拓扑特征
神经退行性疾病
脑网络构建
动态
动态管理系统
动态管理方法
可视化监控平台
LSTM神经网络
态势地图
动态参数辨识
电网系统
电力系统拓扑结构
数据获取模块
大数据