基于动态稀疏化的大模型增量训练方法及系统

AITNT
正文
推荐专利
基于动态稀疏化的大模型增量训练方法及系统
申请号:CN202510186056
申请日期:2025-02-20
公开号:CN119669714B
公开日期:2025-05-09
类型:发明专利
摘要
本发明属于模型训练技术领域,具体涉及基于动态稀疏化的大模型增量训练方法及系统。方法包括:S1,采用多维度的评估方法,对大模型的参数重要性进行评估,反映参数对大模型性能的贡献;S2,采用自适应的结构调整方法,对大模型结构进行动态稀疏化控制;S3,通过构建容量可调的经验回放缓冲池以及提出多目标损失函数,对大模型进行增量训练管理;S4,采用混合精度量化策略,对大模型进行模型压缩优化。本发明具有能够通过实时评估模型参数的重要性,动态调整网络结构,从而在保证模型性能的同时实现高效训练的特点。
技术关键词
增量训练方法 参数 结构调整方法 样本 记忆单元 容量可调 缓冲池 模型压缩 层级 网络结构 分层抽样方法 策略 训练系统 模型训练技术 动态调整机制 连续性 冗余度 度计算方法 精度
系统为您推荐了相关专利信息
1
一种融合模型与数据驱动的双惯量系统位置控制方法
子系统控制器 位置控制方法 周期 跟踪微分器 边界层模型
2
一种基于标志识别的消毒车库位监测方法及监测系统
标志检测模型 标志识别 监测方法 ROI图像 监测系统
3
一种多模态试题知识点标注方法,系统、设备和存储介质
文本特征向量 图像特征向量 知识点标注方法 知识点标签 特征提取网络
4
任务处理方法、设备和存储介质
资源分配策略 节点 参数 分布式系统 处理器
5
一种电梯中人工智能语音模型的建模方法及装置
人工智能语音 语句 建模方法 机器学习模型 标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号