摘要
本发明提供了一种基于增量学习的行业大语言模型微调方法及存储介质,包括:根据难度等级预设的分级框架将收集到的行业数据通过专家进行分级标注,得到带有层级标签的训练集;将训练集数据按由易至难的层级顺序对大语言模型进行强化学习训练,得到训练后的强化大模型;通过分析训练数据特征对不同解码器分配不同的学习超参,对所述强化大模型进行增量学习,得到训练后的行业大模型;收集所述行业大模型实际应用过程中来自专家和行业用户的反馈,进行行业知识沉淀及所述分级框架的优化。该方案中的存储介质在计算机程序被处理器读取并运行时可以实现本发明提供的方法。本技术方案降低了大模型微调时的灾难性遗忘问题,提高模型对领域知识的学习。
技术关键词
微调方法
大语言模型
层级
训练集数据
解码器
文本
字符
可读存储介质
框架
处理器
调度器
计算机
标签
参数
样本
手册
概念
理论