摘要
本公开提供了一种大模型的训练方法、装置、设备以及存储介质,涉及计算机技术领域,尤其涉及大模型、数据处理、深度学习等技术领域。具体实现方案为:将多个目标问题输入待训练大模型,由该待训练大模型输出多个第一响应结果;从多个第一响应结果中,确定错误响应;基于目标问题及错误响应进行聚类,以确定聚类结果;其中,该聚类结果包括多个错误类型以及各个错误类型对应的多个目标问题;基于该聚类结果,生成错误类型对应的训练数据;采用该训练数据,对该待训练大模型进行微调。
技术关键词
聚类
数据
关键词
计算机程序产品
指令
训练装置
处理器通信
输入模块
语义
可读存储介质
存储器
电子设备
频率
逻辑