基于动态稀疏化的大模型增量训练方法及系统

正文

推荐专利

申请号：CN202510186056

申请日期：2025-02-20

公开号：CN119669714B

公开日期：2025-05-09

类型：发明专利

摘要

本发明属于模型训练技术领域，具体涉及基于动态稀疏化的大模型增量训练方法及系统。方法包括：S1，采用多维度的评估方法，对大模型的参数重要性进行评估，反映参数对大模型性能的贡献；S2，采用自适应的结构调整方法，对大模型结构进行动态稀疏化控制；S3，通过构建容量可调的经验回放缓冲池以及提出多目标损失函数，对大模型进行增量训练管理；S4，采用混合精度量化策略，对大模型进行模型压缩优化。本发明具有能够通过实时评估模型参数的重要性，动态调整网络结构，从而在保证模型性能的同时实现高效训练的特点。

技术关键词

增量训练方法参数结构调整方法样本记忆单元容量可调缓冲池模型压缩层级网络结构分层抽样方法策略训练系统模型训练技术动态调整机制连续性冗余度度计算方法精度

系统为您推荐了相关专利信息

一种融合模型与数据驱动的双惯量系统位置控制方法

子系统控制器位置控制方法周期跟踪微分器边界层模型

一种基于标志识别的消毒车库位监测方法及监测系统

标志检测模型标志识别监测方法 ROI图像监测系统

一种多模态试题知识点标注方法，系统、设备和存储介质

文本特征向量图像特征向量知识点标注方法知识点标签特征提取网络

任务处理方法、设备和存储介质

资源分配策略节点参数分布式系统处理器

一种电梯中人工智能语音模型的建模方法及装置

人工智能语音语句建模方法机器学习模型标签

基于动态稀疏化的大模型增量训练方法及系统

站点导航

APP 下载