一种推理模型的调度方法及系统、电子设备、存储介质

AITNT
正文
推荐专利
一种推理模型的调度方法及系统、电子设备、存储介质
申请号:CN202510408403
申请日期:2025-04-01
公开号:CN120469773A
公开日期:2025-08-12
类型:发明专利
摘要
本申请实施例涉及模型推理技术领域,公开了一种推理模型的调度方法及系统、电子设备、存储介质。应用于子负载均衡管理器,方法包括:接收本地预填充节点生成的预填充结果;检测本地解码节点是否支持对预填充结果进行解码处理;在本地解码节点支持对预填充结果进行解码处理的情况下,调度本地解码节点对预填充结果进行解码处理;在本地解码节点不支持对预填充结果进行解码处理的情况下,将预填充结果转发至其它子负载均衡管理器,以通过其它子负载均衡管理器调度远程解码节点对预填充结果进行解码处理,有利于提高推理效率。
技术关键词
管理器 解码 节点 负载均衡器 推理技术 电子设备 资源 调度系统 处理器通信 可读存储介质 存储器 指令 队列 计算机 终端 参数
系统为您推荐了相关专利信息
1
一种基于大数据模型的网络安全管理方法及系统
网络安全管理方法 节点 网络安全管理系统 强化学习框架 方程
2
基于图神经网络和知识图谱的起落架故障系统、构建方法及应用
起落架故障 关系抽取模型 实体 注意力 构建知识图谱
3
一种交通大数据管理方法及系统
大数据管理方法 能效 效能 转移概率矩阵 指标
4
一种基于特征的工艺模型更新方法和系统
管理器 模型更新方法 计数器 浮点数 参数
5
一种数据通信方法和通信设备
通信设备 编解码 矩阵 文本 数据通信方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号