摘要
本发明公开了一种协同标签自进化和相似性正则化的大语言模型持续学习方法及系统。对于需微调以持续学习新任务的大模型,首先判断是否为初始训练阶段,若是,则使用LoRA进行微调得到掌握新任务知识的新模型;否则,利用当前任务少量真实样本,通过掩码引导生成伪输入,结合标签自进化生成伪标签。将历史伪样本、当前伪样本与新任务样本合并构建训练集,依据任务间相似性在LoRA微调中引入正则化,在训练集上微调大语言模型以兼顾新知识学习与旧知识保持。并使用KMeans算法从新任务样本中采样M%用于后续伪样本生成,循环上述步骤直至全部任务完成。本发明融合伪样本重放和正则化策略,有效缓解灾难性遗忘,提升知识迁移效率与数据利用率。
技术关键词
样本
大语言模型
模型学习方法
Kmeans算法
学习系统
生成标签
持续学习方法
模块
正则化策略
构建训练集
阶段
参数
编码
聚类
数据
曲线
动态
系统为您推荐了相关专利信息
语音识别模型
音频特征数据
唤醒词识别方法
命令词识别方法
智能眼镜
离散小波变换
EEG信号分类
局部空间特征
样本
标记器
分布式光伏发电
光伏发电功率
生成方法
偏差
注意力机制算法
序列
K均值聚类算法
网络数据分析技术
样本
网络安全威胁