摘要
本发明涉及人工智能模型训练技术领域,具体涉及一种基于光互联的一体化算力集群调度管理系统,包括:管理平台、多个算力服务器;算力服务器之间、管理平台和算力服务器之间通过光互联网络连接;管理平台通过光互联网络采集算力服务器上的负载状况,管理平台依照负载状况经由光互联网络向算力服务器分配模型训练任务。针对现有技术中的算力集群的模型训练效率受到网络传输速率制约的问题,本方案中,引入了光互联网络连接算力服务器和管理平台,通过光互联网络提升了算力服务器之间的数据同步、管理平台下发训练数据的效率,提高了模型训练效率。
技术关键词
调度管理系统
光互联网络
服务器
任务调度
负载均衡模块
人工智能模型训练技术
集群
判别模块
平台
容器
队列
网关
交换机
页面
生成资源
数据同步
异构
标记
系统为您推荐了相关专利信息
聊天方法
递归神经网络
社交
机器学习模型
信息采集模块
网络通信模块
云电脑系统
智能推荐系统
管理云服务器
存储资源管理
资产
分发系统
区块链分布式记账
计算机程序技术
验证算法
流量入侵检测方法
客户端
数据分布
同态加密算法
中心服务器
任务调度
数据分析单元
数据处理系统
节点
数据采集单元