基于Bert模型的混合剪枝方法、设备及存储介质

AITNT
正文
推荐专利
基于Bert模型的混合剪枝方法、设备及存储介质
申请号:CN202510739571
申请日期:2025-06-04
公开号:CN120579596A
公开日期:2025-09-02
类型:发明专利
摘要
本申请公开了一种基于Bert模型的混合剪枝方法、设备及存储介质,涉及神经网络技术领域,所述基于Bert模型的混合剪枝包括:获取当前次迭代的剪枝量,所述剪枝量根据预设的目标剪枝参数,通过余数补偿策略计算得到;加载第n‑1次迭代生成的掩码矩阵,识别并移除所有标记为零值参数的参数位置,生成仅含非零参数的中间矩阵;将所述中间矩阵的所述非零参数按行优先顺序重新排列为连续存储的稠密矩阵;调整所述稠密矩阵的维度,使所述稠密矩阵行数保持不变,列数缩减至目标维度,以重塑为规则化矩阵,输出剪枝后的所述Bert模型。本申请达成了在保证模型精度的基础上,提高Bert模型的吞吐量的技术效果。
技术关键词
掩码矩阵 注意力 剪枝方法 前馈神经网络 参数 标记 噪声 神经网络技术 剪枝设备 节点 样本 策略 处理器 可读存储介质 总量 存储器 数据 中间层 因子
系统为您推荐了相关专利信息
1
业务预测模型的训练方法、对象筛选方法及相关设备
业务预测模型 对象筛选方法 指标 参数 处理单元
2
一种空中平台地/海面目标检测识别方法及系统
空中平台 检测识别方法 嵌入式硬件 标签分配方法 检测识别系统
3
一种天空地多网融合泛在综合感知智能林火早期报警及蔓延行为预测系统
预测系统 LSTM模型 网关 数据管理系统 智能电池管理系统
4
一种基于AME-TD3算法的热电联产系统控制策略
热电联产系统 控制策略 CHP系统 网络 算法
5
多尺度关联时间序列预测方法、系统、设备、产品及介质
时间序列预测方法 多头注意力机制 非平稳数据 变量 时间序列预测系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号