基于模型蒸馏的变声方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
基于模型蒸馏的变声方法、装置、计算机设备及存储介质
申请号:CN202410974405
申请日期:2024-07-19
公开号:CN118918908A
公开日期:2024-11-08
类型:发明专利
摘要
本发明公开了基于模型蒸馏的变声方法、装置、计算机设备及存储介质,该方法包括:获取包含多条语音数据的基础训练集,并将所述基础训练集中的语音数据与预设的模板音频输入至教师模型中进行蒸馏训练,得到包含蒸馏数据的蒸馏数据集;将所述蒸馏数据集中的蒸馏数据输入至学生模型中进行变声训练,得到变声音频,以此构建实时变声模型;利用所述实时变声模型对指定的音频数据进行变声处理。本发明通过对教师模型进行蒸馏训练,来得到蒸馏数据集,然后利用蒸馏数据集对学生模型进行变声训练,如此不仅能够保留教师模型的部分性能优势,还能显著减少模型参数量和计算开销,从而在保证变声质量的同时,还能够使所述的变声方法适用于更多的系统平台。
技术关键词
变声方法 蒸馏 音频特征 语音 音频波形数据 卷积编码器 前馈神经网络 残差模块 教师 注意力 解码器 模板 计算机设备 信息编码 变声装置 学生 文本编码器 可读存储介质
系统为您推荐了相关专利信息
1
虚拟人物的语音动作同步方法、装置、设备及存储介质
动作同步 序列 动画 语音 标识
2
基于蒸馏学习的学生模型优化方法、设备及可读存储介质
编码模块 模型优化方法 注意力 学生 关系
3
一种识别多类别精神障碍的方法
心率 电信号 医学影像数据 深度学习模型 磁共振成像数据
4
具有语音交互功能的工业机器人
语音交互功能 工业机器人 端面齿轮 麦克风阵列 安装座
5
基于大小语言模型的互联网医疗智能客服系统及方法
智能客服系统 客户端 关键词 互联网 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号