摘要
本发明公开了一种面向传统深度神经网络系统的请求调度系统及方法,包括客户端、调度器和调度侧,利用工作负载信息和模型信息对请求完成时间进行预测,使用启发式的方法对工作负载进行请求分配:通过检测工作负载的执行状态,结合硬件、模型的配置信息,预测工作负载中请求的完成时间,根据系统的实时状态,动态进行请求调度,灵活地调整任务的分配。本发明能够弥补现有的解决方案在深度学习推理系统任务调度方面的不足,并实现高效的深度神经网络系统任务请求调度。
技术关键词
深度神经网络系统
调度系统
调度器
服务端
负载运行状态
调度算法
客户端
队列
阶段
请求调度方法
策略
推理系统
模块
执行器
高性能
任务调度
批量
数据
框架
动态
系统为您推荐了相关专利信息
智能调度系统
多自由度机械臂
调度装置
精加工工艺
运输模块
电量计量系统
网络安全监测
关口表
数据传输模块
数据采集模块
管控平台
系统集成模块
计费模型
数据安全机制
电池健康状态