摘要
本发明公开了一种支持分布式的人工智能标注训练方法及系统,属于人工智能多任务训练调度技术领域,包括:用户管理模块,用于管理用户权限、记录用户操作;数据管理模块,用于数据的上传、保存、标注及版本控制;任务管理模块,用于管理硬件资源,创建训练、模型量化、模型格式转化、模型加密任务以及任务的调度;算法管理模块,包含算法、模型存储、docker镜像服务器及数据库表格记录算法信息;模型发布模块,用于发布模型,提供模型推理能力;前端模块,用于提供用户交互界面。本发明能够整合不同GPU服务器的算力资源,打通数据标注、训练、部署步骤,灵活调度异构分布式训练任务,充分利用服务器资源,降低算法开发难度。
技术关键词
节点
管理用户权限
数据管理模块
管理硬件资源
子模块
记录算法
前端模块
关系型数据库
镜像
命令
任务调度
可视化界面
分布式存储系统
预训练模型
机器可读程序
模板