摘要
本申请实施例涉及模型推理技术领域,公开了一种推理模型的调度方法及系统、电子设备、存储介质。应用于子负载均衡管理器,方法包括:接收本地预填充节点生成的预填充结果;检测本地解码节点是否支持对预填充结果进行解码处理;在本地解码节点支持对预填充结果进行解码处理的情况下,调度本地解码节点对预填充结果进行解码处理;在本地解码节点不支持对预填充结果进行解码处理的情况下,将预填充结果转发至其它子负载均衡管理器,以通过其它子负载均衡管理器调度远程解码节点对预填充结果进行解码处理,有利于提高推理效率。
技术关键词
管理器
解码
节点
负载均衡器
推理技术
电子设备
资源
调度系统
处理器通信
可读存储介质
存储器
指令
队列
计算机
终端
参数
系统为您推荐了相关专利信息
网络安全管理方法
节点
网络安全管理系统
强化学习框架
方程
起落架故障
关系抽取模型
实体
注意力
构建知识图谱