协同标签自进化和相似性正则化的大语言模型学习方法

正文

推荐专利

申请号：CN202510804886

申请日期：2025-06-17

公开号：CN120764625A

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了一种协同标签自进化和相似性正则化的大语言模型持续学习方法及系统。对于需微调以持续学习新任务的大模型，首先判断是否为初始训练阶段，若是，则使用LoRA进行微调得到掌握新任务知识的新模型；否则，利用当前任务少量真实样本，通过掩码引导生成伪输入，结合标签自进化生成伪标签。将历史伪样本、当前伪样本与新任务样本合并构建训练集，依据任务间相似性在LoRA微调中引入正则化，在训练集上微调大语言模型以兼顾新知识学习与旧知识保持。并使用KMeans算法从新任务样本中采样M%用于后续伪样本生成，循环上述步骤直至全部任务完成。本发明融合伪样本重放和正则化策略，有效缓解灾难性遗忘，提升知识迁移效率与数据利用率。

技术关键词

样本大语言模型模型学习方法 Kmeans算法学习系统生成标签持续学习方法模块正则化策略构建训练集阶段参数编码聚类数据曲线动态

系统为您推荐了相关专利信息

命令词识别、唤醒词识别方法、电子设备、存储介质

语音识别模型音频特征数据唤醒词识别方法命令词识别方法智能眼镜

一种基于小波神经量化训练与语义对齐的EEG表征方法

离散小波变换 EEG信号分类局部空间特征样本标记器

一种分布式光伏发电功率生成方法、设备及介质

分布式光伏发电光伏发电功率生成方法偏差注意力机制算法

一种基于数据流分析的网络采集处理方法及系统

序列 K均值聚类算法网络数据分析技术样本网络安全威胁

基于MLOps平台的机器学习模型开发部署方法及装置

机器学习模型训练样本数据超参数集群工作流

协同标签自进化和相似性正则化的大语言模型学习方法

站点导航

APP 下载