摘要
本发明涉及计算中心技术领域,具体涉及一种基于光连接的高性能RoCE网络,包括:采用光网络相互连接的存储模块、模型训练模块和模型推理模块;存储模块中预先存储有模型训练数据;模型训练模块采用模型训练数据对待训练模型进行训练得到业务模型;模型推理模块接收外部的处理需求后采用业务模型生成对应的处理结果并返回。针对现有技术中的智算中心在应用时缺乏调度,同一个计算任务可能被分散在不同位置的集群上导致时延增加的问题,本方案中,对服务器集群进行规划,依照人工智能模型的不同存储需求划分了三个模块,分别对应模型标注、训练和应用的三个部分,将相同类型的任务进行集中布置和调度,从而缩短了传输距离,提高了效率。
技术关键词
模型训练模块
存储模块
高性能
交换机
光网络
网卡
人工智能模型
服务器集群
计算中心
对象
数据
时延
内存
规划
端口
速率