一种大模型的训练方法、装置、设备以及存储介质

正文

推荐专利

申请号：CN202510804954

申请日期：2025-06-16

公开号：CN120747676A

公开日期：2025-10-03

类型：发明专利

摘要

本公开提供了一种大模型的训练方法、装置、设备以及存储介质，涉及计算机技术领域，尤其涉及大模型、数据处理、深度学习等技术领域。具体实现方案为：将多个目标问题输入待训练大模型，由该待训练大模型输出多个第一响应结果；从多个第一响应结果中，确定错误响应；基于目标问题及错误响应进行聚类，以确定聚类结果；其中，该聚类结果包括多个错误类型以及各个错误类型对应的多个目标问题；基于该聚类结果，生成错误类型对应的训练数据；采用该训练数据，对该待训练大模型进行微调。

技术关键词

聚类数据关键词计算机程序产品指令训练装置处理器通信输入模块语义可读存储介质存储器电子设备频率逻辑

一种大模型的训练方法、装置、设备以及存储介质

站点导航

APP 下载