摘要
本发明公开了基于模型蒸馏的变声方法、装置、计算机设备及存储介质,该方法包括:获取包含多条语音数据的基础训练集,并将所述基础训练集中的语音数据与预设的模板音频输入至教师模型中进行蒸馏训练,得到包含蒸馏数据的蒸馏数据集;将所述蒸馏数据集中的蒸馏数据输入至学生模型中进行变声训练,得到变声音频,以此构建实时变声模型;利用所述实时变声模型对指定的音频数据进行变声处理。本发明通过对教师模型进行蒸馏训练,来得到蒸馏数据集,然后利用蒸馏数据集对学生模型进行变声训练,如此不仅能够保留教师模型的部分性能优势,还能显著减少模型参数量和计算开销,从而在保证变声质量的同时,还能够使所述的变声方法适用于更多的系统平台。
技术关键词
变声方法
蒸馏
音频特征
语音
音频波形数据
卷积编码器
前馈神经网络
残差模块
教师
注意力
解码器
模板
计算机设备
信息编码
变声装置
学生
文本编码器
可读存储介质
系统为您推荐了相关专利信息
心率
电信号
医学影像数据
深度学习模型
磁共振成像数据
语音交互功能
工业机器人
端面齿轮
麦克风阵列
安装座