一种用于行业大模型的模型训练方法、装置、设备及介质

AITNT
正文
推荐专利
一种用于行业大模型的模型训练方法、装置、设备及介质
申请号:CN202510825366
申请日期:2025-06-19
公开号:CN120705578A
公开日期:2025-09-26
类型:发明专利
摘要
本申请公开了一种用于行业大模型的模型训练方法、装置、设备及介质,涉及计算机技术领域,包括:创建行业大模型对应的用于进行配比实验的空间并配置信息;基于空间对应的目标标签信息确定多种数据配比组合;在空间内通过预先构建好的Pipeline,针对各种数据配比组合及超参范围配置文件发起行业大模型对应的第一搜参跑批任务,以筛选出当前最优的目标超参范围配置文件及第一训练后模型;基于目标超参范围配置文件及多种数据配比组合发起与第一训练后模型对应的第二搜参跑批任务,以筛选出当前最优的目标数据配比组合及第二训练后模型;判断当前是否满足预设Pipeline迭代终止条件。本申请能够实现超参数与训练数据配比的联合优化。
技术关键词
模型训练方法 数据 标签 训练集 模型训练装置 标记 模块 超参数 可读存储介质 处理器 样本 电子设备 列表 存储器 计算机
系统为您推荐了相关专利信息
1
一种基于分布式并行处理的大模型预训练系统
分布式并行处理 模型预训练 大规模异构计算 分片 时间序列预测模型
2
一种结合BIM的机电综合管线运维监管方法及系统
运维监管 运维管控 指标 建筑物模型 标识
3
港口运输数据的自动标注方法及装置
数据标注平台 标注方法 实体 格式 标注装置
4
一种基于行人轨迹数据的城市社区组团信息提取方法
建筑物 信息提取方法 城市社区 交互特征 轨迹
5
防火墙配置获取方法、系统及计算机可读存储介质
防火墙配置 分类网络 CRF模型 汉明距离 文本识别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号