摘要
本公开提供一种模型训练的任务处理方法和系统,涉及模型训练技术领域。该方法的具体实施方式包括:接收客户端发起的一个或多个训练任务的执行请求;其中,执行请求包括任务标识、客户端标识和服务集群的集群标识;利用验证数据库对客户端标识和集群标识进行验证,得到验证结果;从验证数据库获取与客户端标识匹配的第一密码和与集群标识匹配的第二密码,分别利用第一密码、第二密码对验证结果和任务标识进行加密,得到第一密文和第二密文,将第一密文和第二密文返回客户端。该实施方式能够在分布式模型训练框架下管控用户的访问权限,实现任务粒度的精细管控,保证任务数据的逻辑隔离与绝对保密,提升训练效率,可用性高且运行稳定。
技术关键词
客户端
验证数据库
标识
资源分配请求
分配组件
服务集群
存储组件
令牌
密码
凭证
身份
解密
资源管理节点
模型训练技术
指令
分布式模型
关系