摘要
本申请公开了一种数据处理方法、装置、设备及可读存储介质,该方法包括:获取业务任务集合;获取在大语言模型的第i‑1轮迭代中,针对第i‑1轮迭代的训练样本集所输出的业务预测结果,根据业务预测结果与第i‑1轮迭代的训练样本集对应的训练样本标签,对大语言模型在第i‑1轮迭代中的模型参考难度值进行更新,得到目标模型参考难度值;基于每个业务任务的任务难度值分别与目标模型参考难度值之间的难度值差值,在业务任务集合中获取与目标模型参考难度值相匹配的业务任务,将相匹配的业务任务作为针对第i轮迭代的训练样本集。采用本申请,可以通过难度合适的业务任务提升大语言模型的推理能力和训练效率。
技术关键词
大语言模型
训练样本集
标签
数据处理方法
计算机设备
计算机程序产品
可读存储介质
处理器
数据通信功能
网络接口
参数
存储计算机程序
数据处理装置
复杂度
文本
收发模块
存储器
语义
系统为您推荐了相关专利信息
程序转换系统
数据显示系统
微型开关
异常数据
灯检合格率
图像融合方法
融合特征
卷积特征
输出特征
图像融合装置
生命周期管理方法
节点
全生命周期管理
数据
编辑