摘要
本公开提供了一种大模型资料集处理方法、装置、设备及存储介质,其中,该方法包括:获取预先构建的大模型算法及大模型训练所需的第一学习资料集、以及预先模拟有目标因子关系的第二学习资料集及模拟第二学习资料集所需的模拟算法;将模拟算法增添至大模型算法,将第二学习资料集增添至第一学习资料集;基于更新后大模型算法对更新后第一学习资料集中的各个学习资料进行因子关系标注;响应于标注结果指示是否出现目标因子关系,确定针对更新后第一学习资料集的处理策略,和/或,针对更新后大模型算法的修改策略。本公开具有更精确的大数据资料筛选效果及大模型校正锚定效果,明显减少了大模型训练迭代学习时间与算力,减少资料筛选所需人力成本。
技术关键词
模型算法
时间序列关系
因子
分群
资料
检定方法
机器可读指令
策略
校正
处理器
可读存储介质
电子设备
极值
存储器
指标
模块
形态
计算机
系统为您推荐了相关专利信息
故障诊断方法
传送带
执行器电机
速度
执行器故障诊断技术
数字高程模型数据
地质灾害防治工程技术
变异系数法
指数
水文分析方法
资源分配策略
资源分配模块
梯度算法
资源分配方法
参数