摘要
本发明属于模型训练技术领域,具体涉及基于动态稀疏化的大模型增量训练方法及系统。方法包括:S1,采用多维度的评估方法,对大模型的参数重要性进行评估,反映参数对大模型性能的贡献;S2,采用自适应的结构调整方法,对大模型结构进行动态稀疏化控制;S3,通过构建容量可调的经验回放缓冲池以及提出多目标损失函数,对大模型进行增量训练管理;S4,采用混合精度量化策略,对大模型进行模型压缩优化。本发明具有能够通过实时评估模型参数的重要性,动态调整网络结构,从而在保证模型性能的同时实现高效训练的特点。
技术关键词
增量训练方法
参数
结构调整方法
样本
记忆单元
容量可调
缓冲池
模型压缩
层级
网络结构
分层抽样方法
策略
训练系统
模型训练技术
动态调整机制
连续性
冗余度
度计算方法
精度
系统为您推荐了相关专利信息
子系统控制器
位置控制方法
周期
跟踪微分器
边界层模型
标志检测模型
标志识别
监测方法
ROI图像
监测系统
文本特征向量
图像特征向量
知识点标注方法
知识点标签
特征提取网络