摘要
本发明公开了一种语音模型压缩方法、电子设备及存储介质。本发明专为具有编码器‑解码器架构的大规模序列到序列语音识别模型设计。该方法通过依次剪枝解码器和编码器,避免了繁重的反向传播计算。该方法能在无反向传播或重训练的情况下,将Whisper‑large模型的参数减少约60%,且对模型在各种数据集上的表现几乎没有影响。同时,该方法适用于多语言数据集,剪枝后模型在多语言能力上保持了良好的鲁棒性和泛化性。此创新极大降低了大规模模型部署的门槛,使其在资源受限的环境中更易应用。
技术关键词
重建误差
语音识别模型
编码器
模型压缩方法
矩阵
注意力
音频特征提取
解码器架构
层级
校准特征
稠密特征
电子设备
处理器
灵活可调
数据
控制误差
计算机程序产品
系统为您推荐了相关专利信息
卡尔曼滤波模型
协方差矩阵
信息更新
数据
可读存储介质
意图识别模型
意图识别方法
语音
特征提取算法
主成分分析算法
笛卡尔
检测识别方法
信息融合方法
图像配准
全局平均池化