模型推理调度方法及系统、电子设备和存储介质

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
推荐专利
模型推理调度方法及系统、电子设备和存储介质
申请号:CN202511415359
申请日期:2025-09-29
公开号:CN120909737B
公开日期:2025-12-09
类型:发明专利
摘要
本公开提供了一种模型推理调度方法及系统、电子设备和存储介质,该系统包括多个预填充服务器节点和多个解码服务器节点,方法包括:响应于接收到用户请求信息,结合基于深度强化学习的预填充调度模型,获取从多个预填充服务器节点中选择的目标预填充服务器节点和第一优先级;向目标预填充服务器节点中的与第一优先级对应的请求队列发送预填充请求,令目标预填充服务器节点处理预填充请求;预填充请求处理完成,结合基于深度强化学习的解码调度模型,获取从多个解码服务器节点中选择的目标解码服务器节点和第二优先级;向目标解码服务器节点中的与第二优先级对应的请求队列发送解码请求,令目标解码服务器节点处理解码请求;提升推理效率。
技术关键词
服务器节点 解码服务器 深度强化学习 时间预测模型 多级反馈队列 策略 键值 数据训练神经网络 调度系统 电子设备 计算机程序产品 参数 处理器通信
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号