摘要
本发明公开了一种面向医学大模型压缩的混合动态剪枝方法,采用基于混合稀疏预测的稀疏预测器,相比其他单纯基于动态稀疏预测的动态剪枝方法具有降低性能损失的优势。有效解决目前医学大模型压缩后性能下降严重的问题,并提高模型推理速度,为实现高稀疏化,高性能的大模型在实际应用的推广和应用提供了可行的解决方案。
技术关键词
注意力
动态剪枝
模型压缩
医学
推理机制
Softmax函数
序列
表达式
文本
编码
数据
指标
掩码矩阵
模型块
输出特征
高性能
非线性
参数
系统为您推荐了相关专利信息
多模态医学影像
融合特征
三维结构
数据处理模块
卷积神经网络提取
精准控制方法
智能电梯
电梯按钮
门控循环单元
特征提取模块