模型推理调度方法及系统、电子设备和存储介质

AITNT
正文
推荐专利
模型推理调度方法及系统、电子设备和存储介质
申请号:CN202511415359
申请日期:2025-09-29
公开号:CN120909737B
公开日期:2025-12-09
类型:发明专利
摘要
本公开提供了一种模型推理调度方法及系统、电子设备和存储介质,该系统包括多个预填充服务器节点和多个解码服务器节点,方法包括:响应于接收到用户请求信息,结合基于深度强化学习的预填充调度模型,获取从多个预填充服务器节点中选择的目标预填充服务器节点和第一优先级;向目标预填充服务器节点中的与第一优先级对应的请求队列发送预填充请求,令目标预填充服务器节点处理预填充请求;预填充请求处理完成,结合基于深度强化学习的解码调度模型,获取从多个解码服务器节点中选择的目标解码服务器节点和第二优先级;向目标解码服务器节点中的与第二优先级对应的请求队列发送解码请求,令目标解码服务器节点处理解码请求;提升推理效率。
技术关键词
服务器节点 解码服务器 深度强化学习 时间预测模型 多级反馈队列 策略 键值 数据训练神经网络 调度系统 电子设备 计算机程序产品 参数 处理器通信
系统为您推荐了相关专利信息
1
一种列车无线信号增强系统及方法
AP设备 超表面 无线网络覆盖区域 中心服务器 调控算法
2
一种自适应经验重放的深度强化学习训练优化方法及装置
训练优化方法 深度强化学习 样本 建立预测模型 回归算法
3
基于游戏开发数据调整的游戏更新方法及系统、存储介质
游戏更新方法 深度强化学习模型 采集运行数据 系统性能数据 仿真平台
4
一种家居设备的远程物联控制系统及控制方法
物联控制系统 家居设备 家居系统 设备控制指令 历史故障数据
5
基于深度强化学习的城市照明节能调控方法及系统
城市照明 深度网络模型 节能调控系统 节能调控方法 调控策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号