摘要
本发明公开了一种基于容器的大模型训练方法,涉及模型训练技术领域,用于解决现有数据集管理复杂,获取效率低的问题,该方法包括以下步骤:构建数据集,并根据所述数据集生成OCI镜像;通过Kubernetes集群加载所述OCI镜像;通过所述Kubernetes集群中的主训练容器执行模型训练,其中,训练时的数据加载通过Kubernetes集群中的Datasetscar容器完成。本发明还公开了一种基于容器的大模型训练系统。本发明通过将数据集封装为OCI镜像,使用时只需获取镜像文件,便于管理和版本控制。
技术关键词
模型训练方法
镜像
模型训练系统
模型训练技术
服务端
命令行工具
容器组
数据格式
目录
集群
资源
进程
系统为您推荐了相关专利信息
模型训练方法
图像校正方法
图像处理模型
计算机程序指令
交叉注意力机制
服务器节点
深度神经网络模型
多分支
分布式架构
时延
风险模型训练方法
深度神经网络模型
节点
样本
差分隐私技术
能力评估方法
电子显微镜
数据
肿瘤
薄板样条插值