推理重调度方法、装置、设备、介质及计算机程序产品

AITNT
正文
推荐专利
推理重调度方法、装置、设备、介质及计算机程序产品
申请号:CN202410723443
申请日期:2024-06-05
公开号:CN118798355A
公开日期:2024-10-18
类型:发明专利
摘要
本发明提供一种推理重调度方法、装置、设备及可读存储介质。应用于包括推理调度器和多个推理服务器的推理调度系统。方法包括:在推理调度器与服务注册中心合设的情况下,基于每个推理服务器上报的负载状态信息,确定待重调度的第一推理服务器以及接收重调度的目标推理服务器;在推理调度器与推理服务器的流量网关合设的情况下,基于推理调度器记录的每个推理服务器的请求处理信息,确定待重调度的第一推理服务器以及接收重调度的目标推理服务器;基于第一推理服务器的请求排队时间信息,以及目标推理服务器的请求数量信息,将第一推理服务器的待重调度请求发送给目标推理服务器。本申请提升了推理重调度的整体性能。
技术关键词
推理服务器 重调度方法 负载状态信息 服务注册中心 调度器 调度系统 计算机程序产品 处理器 网关 队列 调度装置 存储器 电子设备 模块 介质 数据
系统为您推荐了相关专利信息
1
一种汽车自动驾驶图片自动标注系统及方法
汽车自动驾驶 标注系统 图片 筛选器 双曲正切函数
2
一种基于大数据的计算机数据管理系统
分布式数据采集 策略 节流控制器 防护体系 分布式混合架构
3
一种面向机载环境的云原生资源调度部署控制系统及方法
异构 资源控制器 资源调度器 资源定义 资源状态信息
4
基于字节码增强的视频AI算法模型的自动训练方法和装置
AI算法 自动训练方法 视频 数据 调度器
5
基于移动目标防御系统工作量证明的用户接入方法及装置
工作量证明 防御系统 身份验证 非暂态计算机可读存储介质 应用服务器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号