一种融合剪枝量化联合优化的模型压缩方法

AITNT
正文
推荐专利
一种融合剪枝量化联合优化的模型压缩方法
申请号:CN202510164883
申请日期:2025-02-14
公开号:CN120106167A
公开日期:2025-06-06
类型:发明专利
摘要
本发明提供了一种融合剪枝量化联合优化的模型压缩方法,包括:获取待剪枝的模型;获取为模型构建的量化模块,其通过可学习的量化参数对模型的可训练参数进行量化以得到对应的量化值,其中,每个可训练参数对应的量化值比其自身的数据量更小;利用训练语料对模型和量化模块进行剪枝和量化优化的联合训练,得到经联合训练后的模型和量化模块,其中,训练时的正向传播中用可训练参数对应的量化值来暂代可训练参数进行计算,反向传播中以最小化预设的总损失函数的值为目标对可训练参数和量化参数进行更新;对经联合训练后的模型进行剪枝,得到剪枝后的模型;利用经联合训练后的量化模块对剪枝后的模型中的可训练参数进行量化,得到经量化后的模型。
技术关键词
模型压缩方法 缩放参数 模块 计算机程序产品 自然语言 处理器 指令 存储器 指标 电子设备 偏差
系统为您推荐了相关专利信息
1
资源推荐方法、训练深度学习模型的方法、装置及智能体
融合特征 样本 注意力机制 训练深度学习模型 资源推荐方法
2
一种基于GCN的农业气象灾害事件触发词抽取方法
掩码矩阵 依存句法分析 气象预测技术 节点特征 文本
3
任务执行方法、计算机设备、存储介质及程序产品
资源分配信息 令牌 解码模型 内存 分块
4
一种基于VR虚拟现实结合恐惧诱发情绪下的风险决策评估方法
决策 VR虚拟现实技术 生理 数据收集设备 风险
5
一种结合矛盾纠纷知识图谱的智能问答系统
知识图谱查询 智能问答系统 查询主体 意图识别 查询意图
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号