推理系统的负载感知调度方法和推理系统

AITNT
正文
推荐专利
推理系统的负载感知调度方法和推理系统
申请号:CN202411646359
申请日期:2024-11-15
公开号:CN119149252B
公开日期:2025-07-18
类型:发明专利
摘要
本申请一个或多个实施例提供一种推理系统的负载感知调度方法和推理系统,所述方法应用于推理系统中的全局调度器;所述推理系统还包括推理引擎;所述推理引擎包括部署在计算集群中的各个计算节点上的至少一个计算实例;所述计算实例的计算资源包括所在的计算节点上搭载的GPU;所述全局调度器维护了动态更新的各个计算实例的GPU负载信息;所述方法包括:获取待执行的目标推理请求;基于所维护的各个计算实例的GPU负载信息,确定GPU负载满足预设条件的目标计算实例;将所述目标推理请求发送至所述目标计算实例,以由所述目标计算实例执行所述目标推理请求。
技术关键词
推理系统 全局调度器 内存 节点 动态更新 资源 集群 处理器 信息更新 指令 可读存储介质 计算机 指标 令牌 电子设备 存储器 周期
系统为您推荐了相关专利信息
1
交易数据处理方法及装置
线性回归模型 交易数据处理方法 时间预测模型 节点 逻辑回归模型
2
一种航空发动机钛合金空心风扇叶片强度评估方法
空心风扇叶片 强度评估方法 应力 高风险 钛合金
3
一种基于F107指数年滑月均值预测长期太阳活动水平的方法
指数 太阳 RBF神经网络 非暂态计算机可读存储介质 数据
4
一种高精地图用智能图像识别方法
地图要素 智能图像识别方法 节点 基础 轮廓信息
5
去中心化联邦学习的处理方法、装置、终端设备及产品
客户端 数据 终端设备 分布式系统 计算机程序产品
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号