摘要
本申请公开了一种基于Bert模型的混合剪枝方法、设备及存储介质,涉及神经网络技术领域,所述基于Bert模型的混合剪枝包括:获取当前次迭代的剪枝量,所述剪枝量根据预设的目标剪枝参数,通过余数补偿策略计算得到;加载第n‑1次迭代生成的掩码矩阵,识别并移除所有标记为零值参数的参数位置,生成仅含非零参数的中间矩阵;将所述中间矩阵的所述非零参数按行优先顺序重新排列为连续存储的稠密矩阵;调整所述稠密矩阵的维度,使所述稠密矩阵行数保持不变,列数缩减至目标维度,以重塑为规则化矩阵,输出剪枝后的所述Bert模型。本申请达成了在保证模型精度的基础上,提高Bert模型的吞吐量的技术效果。
技术关键词
掩码矩阵
注意力
剪枝方法
前馈神经网络
参数
标记
噪声
神经网络技术
剪枝设备
节点
样本
策略
处理器
可读存储介质
总量
存储器
数据
中间层
因子
系统为您推荐了相关专利信息
空中平台
检测识别方法
嵌入式硬件
标签分配方法
检测识别系统
预测系统
LSTM模型
网关
数据管理系统
智能电池管理系统
时间序列预测方法
多头注意力机制
非平稳数据
变量
时间序列预测系统