基于模型蒸馏的变声方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202410974405

申请日期：2024-07-19

公开号：CN118918908A

公开日期：2024-11-08

类型：发明专利

摘要

本发明公开了基于模型蒸馏的变声方法、装置、计算机设备及存储介质，该方法包括：获取包含多条语音数据的基础训练集，并将所述基础训练集中的语音数据与预设的模板音频输入至教师模型中进行蒸馏训练，得到包含蒸馏数据的蒸馏数据集；将所述蒸馏数据集中的蒸馏数据输入至学生模型中进行变声训练，得到变声音频，以此构建实时变声模型；利用所述实时变声模型对指定的音频数据进行变声处理。本发明通过对教师模型进行蒸馏训练，来得到蒸馏数据集，然后利用蒸馏数据集对学生模型进行变声训练，如此不仅能够保留教师模型的部分性能优势，还能显著减少模型参数量和计算开销，从而在保证变声质量的同时，还能够使所述的变声方法适用于更多的系统平台。

技术关键词

变声方法蒸馏音频特征语音音频波形数据卷积编码器前馈神经网络残差模块教师注意力解码器模板计算机设备信息编码变声装置学生文本编码器可读存储介质

系统为您推荐了相关专利信息

虚拟人物的语音动作同步方法、装置、设备及存储介质

动作同步序列动画语音标识

基于蒸馏学习的学生模型优化方法、设备及可读存储介质

编码模块模型优化方法注意力学生关系

一种识别多类别精神障碍的方法

心率电信号医学影像数据深度学习模型磁共振成像数据

具有语音交互功能的工业机器人

语音交互功能工业机器人端面齿轮麦克风阵列安装座

基于大小语言模型的互联网医疗智能客服系统及方法

智能客服系统客户端关键词互联网数据

基于模型蒸馏的变声方法、装置、计算机设备及存储介质

站点导航

APP 下载