摘要
本发明提供一种基于集群部署模型的系统及方法,可以提升模型在集群中部署后的资源利用率。基于集群部署模型的系统包括:调度控制器,所述调度控制器用于接收推理请求,调整多模型共享容器组的资源分配,并将所述推理请求分发到对应模型所属的多模型共享容器组上;多模型共享容器组,所述多模型共享容器组与所述调度控制器通信连接,所述多模型共享容器组用于同时运行多个相同类型的模型;分布式存储器,所述分布式存储器与所述多模型共享容器组通信连接,所述分布式存储器用于存储所述多模型共享容器组的模型文件数据及模型元数据。
技术关键词
分布式存储器
多模型
调度控制器
容器组
集群
资源分配
分配组件
监控模块
匹配模块
分析模块
存储模块
决策
数据
配额
多线程
格式
进程
系统为您推荐了相关专利信息
数据智能检索方法
云数据中心
多模态
检索标签
检索平台
应急响应方法
YOLO模型
BERT模型
分布式爬虫集群
应急响应装置
无人机集群系统
无人车系统
中央管理平台
无人机集群协同
路径规划系统