一种大语言模型训练方法及装置

正文

推荐专利

一种大语言模型训练方法及装置

申请号：CN202411810781

申请日期：2024-12-10

公开号：CN119740621A

公开日期：2025-04-01

类型：发明专利

摘要

本申请实施例公开了一种大语言模型训练方法及装置。该方法包括：将全量训练数据输入至大模型中进行训练；确定大模型的大模型性能数据；根据大模型性能数据从全量训练数据中选择至少部分训练数据作为目标训练数据，基于目标训练数据对应的大模型性能数据进行参数优化调整；若不满足预设条件，返回从将全量训练数据输入至大模型中进行训练开始继续执行。上述方案根据大模型性能数据选择出相对优质的训练数据，先基于该部分训练数据对应的大模型性能数据进行参数调优，使模型能够快速优化，模型能力提升的情况下，进一步提升了对其他训练数据的学习能力，继续将全量训练数据输入参与参数优化调整，提高了模型训练效率和泛化能力。

技术关键词

数据大语言模型参数标记训练装置模块

系统为您推荐了相关专利信息

一种基于电子海图的仿真图像显示方法及系统

海洋信息数据图像显示方法偏差雷达船舶

跟网型变流器暂态过电压抑制控制参数优化方法和系统

电流环参数暂态过电压变流器控制参数优化方法二阶系统

一种基于自动化的运动线缆生产速度智能控制方法及系统

速度智能控制线缆订单设备状态信息运动

一种基于低秩自适应微调LoRA的自适应故障检测方法

故障检测模型故障类别样本故障检测方法注意力

基于多模态增强转换器和超图结构的人体骨骼行为识别方法

骨骼特征多模态注意力人体骨骼双人

一种大语言模型训练方法及装置

站点导航

APP 下载