推理系统的负载感知调度方法和推理系统

AITNT
正文
推荐专利
推理系统的负载感知调度方法和推理系统
申请号:CN202411588173
申请日期:2024-11-07
公开号:CN119512748B
公开日期:2025-10-31
类型:发明专利
摘要
本申请一个或多个实施例提供一种推理系统的负载感知调度方法和推理系统,该方法应用于包括全局调度器和推理引擎的推理系统;推理引擎包括Prefill引擎和Decode引擎;Prefill引擎和Decode引擎分别包括至少一个计算实例;计算实例的计算资源包括所在的计算节点上搭载的GPU;该方法包括:全局调度器获取待执行的目标推理请求,以及基于所维护的GPU负载信息,确定GPU负载满足第一预设条件的Prefill引擎中的第一计算实例,并将目标推理请求发送至第一计算实例执行Prefill阶段的推理计算;Prefill引擎中与第一计算实例对应的第一本地调度器基于所维护的GPU负载信息,确定GPU负载满足第二预设条件的Decode引擎中的第二计算实例,并将Prefill阶段的推理计算结果发送至第二计算实例执行Decode阶段的推理计算。
技术关键词
推理系统 全局调度器 多处理器 动态更新 阶段 资源 内存 信息更新 时钟 指令 节点 可读存储介质 频率 计算机 指标 令牌 周期 电子设备
系统为您推荐了相关专利信息
1
植入式心律转复除颤器电源单元及植入式心律转复除颤器
电源单元 线性电源 开关电源 阶段 控制器
2
物品储存方法、装置、设备及可读存储介质
物品储存 高投入产出比 容器内物品 共识算法 数据
3
一种特征切分的分布式图卷积神经网络实现方法
切片 分片 卷积神经网络方法 生成特征 策略
4
基于标识解析的动态因果知识图谱构建方法、系统及设备
知识图谱构建方法 实体识别模型 时序 传感器节点 文本
5
一种基于双任务CNN的ATE晶圆图的缺陷检测方法
缺陷检测方法 自动化测试设备 网络模型结构 分支 缺陷类别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号