摘要
本申请公开了一种用于行业大模型的模型训练方法、装置、设备及介质,涉及计算机技术领域,包括:创建行业大模型对应的用于进行配比实验的空间并配置信息;基于空间对应的目标标签信息确定多种数据配比组合;在空间内通过预先构建好的Pipeline,针对各种数据配比组合及超参范围配置文件发起行业大模型对应的第一搜参跑批任务,以筛选出当前最优的目标超参范围配置文件及第一训练后模型;基于目标超参范围配置文件及多种数据配比组合发起与第一训练后模型对应的第二搜参跑批任务,以筛选出当前最优的目标数据配比组合及第二训练后模型;判断当前是否满足预设Pipeline迭代终止条件。本申请能够实现超参数与训练数据配比的联合优化。
技术关键词
模型训练方法
数据
标签
训练集
模型训练装置
标记
模块
超参数
可读存储介质
处理器
样本
电子设备
列表
存储器
计算机
系统为您推荐了相关专利信息
分布式并行处理
模型预训练
大规模异构计算
分片
时间序列预测模型
防火墙配置
分类网络
CRF模型
汉明距离
文本识别