模型训练方法、装置、电子设备及存储介质

正文

推荐专利

模型训练方法、装置、电子设备及存储介质

申请号：CN202511154462

申请日期：2025-08-18

公开号：CN120975180A

公开日期：2025-11-18

类型：发明专利

摘要

本申请实施例提供了一种模型训练方法、装置、电子设备及存储介质，涉及人工智能领域，例如，可用于大模型领域、强化学习领域等。该方法包括：获取第一训练集，每一训练数据包括第一训练样本以及对应的第一标签；基于第一训练集对初始模型进行训练，得到微调后的训练模型，并获取训练过程中初始模型输出的关于每一第一训练样本的错误输出；获取第二训练集，基于第二训练集对微调后的模型进行训练，得到逻辑推理模型。通过提供充足且类型丰富的训练数据的方式解决了训练模式单一、模型能力发展片面、模型思考能力弱、泛化能力弱的问题，使得训练得到的模型具备较强的泛化能力，能适应不同类型的输入数据的变化，提高了模型的适用性、泛化性及效果。

技术关键词

标签字符样本训练集模型训练方法文本模型训练模块逻辑神经网络参数生成提示信息模型训练装置数据电子设备下轮大语言模型处理器可读存储介质存储器语义

模型训练方法、装置、电子设备及存储介质

站点导航

APP 下载