一种语音模型压缩方法、电子设备及存储介质

正文

推荐专利

申请号：CN202510083506

申请日期：2025-01-17

公开号：CN119905087B

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了一种语音模型压缩方法、电子设备及存储介质。本发明专为具有编码器‑解码器架构的大规模序列到序列语音识别模型设计。该方法通过依次剪枝解码器和编码器，避免了繁重的反向传播计算。该方法能在无反向传播或重训练的情况下，将Whisper‑large模型的参数减少约60％，且对模型在各种数据集上的表现几乎没有影响。同时，该方法适用于多语言数据集，剪枝后模型在多语言能力上保持了良好的鲁棒性和泛化性。此创新极大降低了大规模模型部署的门槛，使其在资源受限的环境中更易应用。

技术关键词

重建误差语音识别模型编码器模型压缩方法矩阵注意力音频特征提取解码器架构层级校准特征稠密特征电子设备处理器灵活可调数据控制误差计算机程序产品

系统为您推荐了相关专利信息

一种智能模糊处理的保密摄像方法

摄像方法后续图像处理视频流身份主控芯片

一种基于近红外光谱数据确定电缆绝缘层机械性能的方法

定量分析模型电缆绝缘层波长样本 PLS模型

车辆的位姿信息的预测方法、装置和计算机可读存储介质

卡尔曼滤波模型协方差矩阵信息更新数据可读存储介质

一种索赔意图识别方法及系统

意图识别模型意图识别方法语音特征提取算法主成分分析算法

一种基于笛卡尔积的多源遥感信息融合目标检测识别方法

笛卡尔检测识别方法信息融合方法图像配准全局平均池化

一种语音模型压缩方法、电子设备及存储介质

站点导航

APP 下载