协同标签自进化和相似性正则化的大语言模型学习方法

AITNT
正文
推荐专利
协同标签自进化和相似性正则化的大语言模型学习方法
申请号:CN202510804886
申请日期:2025-06-17
公开号:CN120764625A
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了一种协同标签自进化和相似性正则化的大语言模型持续学习方法及系统。对于需微调以持续学习新任务的大模型,首先判断是否为初始训练阶段,若是,则使用LoRA进行微调得到掌握新任务知识的新模型;否则,利用当前任务少量真实样本,通过掩码引导生成伪输入,结合标签自进化生成伪标签。将历史伪样本、当前伪样本与新任务样本合并构建训练集,依据任务间相似性在LoRA微调中引入正则化,在训练集上微调大语言模型以兼顾新知识学习与旧知识保持。并使用KMeans算法从新任务样本中采样M%用于后续伪样本生成,循环上述步骤直至全部任务完成。本发明融合伪样本重放和正则化策略,有效缓解灾难性遗忘,提升知识迁移效率与数据利用率。
技术关键词
样本 大语言模型 模型学习方法 Kmeans算法 学习系统 生成标签 持续学习方法 模块 正则化策略 构建训练集 阶段 参数 编码 聚类 数据 曲线 动态
系统为您推荐了相关专利信息
1
命令词识别、唤醒词识别方法、电子设备、存储介质
语音识别模型 音频特征数据 唤醒词识别方法 命令词识别方法 智能眼镜
2
一种基于小波神经量化训练与语义对齐的EEG表征方法
离散小波变换 EEG信号分类 局部空间特征 样本 标记器
3
一种分布式光伏发电功率生成方法、设备及介质
分布式光伏发电 光伏发电功率 生成方法 偏差 注意力机制算法
4
一种基于数据流分析的网络采集处理方法及系统
序列 K均值聚类算法 网络数据分析技术 样本 网络安全威胁
5
基于MLOps平台的机器学习模型开发部署方法及装置
机器学习模型 训练样本数据 超参数 集群 工作流
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号