摘要
本公开提供了一种模型推理调度方法及系统、电子设备和存储介质,该系统包括多个预填充服务器节点和多个解码服务器节点,方法包括:响应于接收到用户请求信息,结合基于深度强化学习的预填充调度模型,获取从多个预填充服务器节点中选择的目标预填充服务器节点和第一优先级;向目标预填充服务器节点中的与第一优先级对应的请求队列发送预填充请求,令目标预填充服务器节点处理预填充请求;预填充请求处理完成,结合基于深度强化学习的解码调度模型,获取从多个解码服务器节点中选择的目标解码服务器节点和第二优先级;向目标解码服务器节点中的与第二优先级对应的请求队列发送解码请求,令目标解码服务器节点处理解码请求;提升推理效率。
技术关键词
服务器节点
解码服务器
深度强化学习
时间预测模型
多级反馈队列
策略
键值
数据训练神经网络
调度系统
电子设备
计算机程序产品
参数
处理器通信
系统为您推荐了相关专利信息
AP设备
超表面
无线网络覆盖区域
中心服务器
调控算法
训练优化方法
深度强化学习
样本
建立预测模型
回归算法
游戏更新方法
深度强化学习模型
采集运行数据
系统性能数据
仿真平台
物联控制系统
家居设备
家居系统
设备控制指令
历史故障数据
城市照明
深度网络模型
节能调控系统
节能调控方法
调控策略