一种大语言模型参数的微调训练方法、系统及介质

正文

推荐专利

申请号：CN202410905584

申请日期：2024-07-08

公开号：CN119067171A

公开日期：2024-12-03

类型：发明专利

摘要

本发明公开了一种大语言模型参数的微调训练方法、系统及介质，涉及自然语言处理技术领域，包括设置调整数据，对调整数据进行划分；计算模型的准确率，输出初始准确率；对初始语言模型进行部分参数冻结，进行模型训练，输出微调语言模型；计算模型的准确率，输出调整准确率；对调整准确率以及初始准确率进行分析，进行再训练处理或输出调整完成信息；本发明用于解决现有技术中因对模型架构分析存在不足，无法准确进行部分参数的微调，在全微调时需要提供足够的内存和计算预算，导致微调的效率以及适用性较低的问题。

技术关键词

大语言模型数据参数模型训练模块标记自然语言训练系统传播算法定义介质内存处理器

一种大语言模型参数的微调训练方法、系统及介质

站点导航

APP 下载