一种基于增量学习的行业大语言模型微调方法及存储介质

正文

推荐专利

申请号：CN202411553856

申请日期：2024-11-01

公开号：CN119476367A

公开日期：2025-02-18

类型：发明专利

摘要

本发明提供了一种基于增量学习的行业大语言模型微调方法及存储介质，包括：根据难度等级预设的分级框架将收集到的行业数据通过专家进行分级标注，得到带有层级标签的训练集；将训练集数据按由易至难的层级顺序对大语言模型进行强化学习训练，得到训练后的强化大模型；通过分析训练数据特征对不同解码器分配不同的学习超参，对所述强化大模型进行增量学习，得到训练后的行业大模型；收集所述行业大模型实际应用过程中来自专家和行业用户的反馈，进行行业知识沉淀及所述分级框架的优化。该方案中的存储介质在计算机程序被处理器读取并运行时可以实现本发明提供的方法。本技术方案降低了大模型微调时的灾难性遗忘问题，提高模型对领域知识的学习。

技术关键词

微调方法大语言模型层级训练集数据解码器文本字符可读存储介质框架处理器调度器计算机标签参数样本手册概念理论

一种基于增量学习的行业大语言模型微调方法及存储介质

站点导航

APP 下载