摘要
本申请提供了一种推理方法、装置、设备、集群、产品以及介质。所述方法包括:网关基于第一推理请求从多个计算实例中选择第一计算实例,并将第一推理请求发送给第一计算实例;第一计算实例根据第一推理请求进行推理得到第一推理结果以及中间参数;第一计算实例将第一推理请求、第一推理结果以及中间参数存储在内存池中;第一计算实例将第一推理请求返回给所述网关;网关基于第一推理请求从多个计算实例中选择第二计算实例,并将第一推理请求发送给第二计算实例;第二计算实例基于第一推理请求从内存池中读取第一推理结果以及中间参数存储,并基于第一推理结果以及中间参数继续进行推理得到第二推理结果,第二推理结果包含第一推理结果。
技术关键词
推理方法
网关
参数
集群
矩阵
计算机程序指令
内存
标记
推理装置
存储器
计算机程序产品
处理器
可读存储介质
模块
系统为您推荐了相关专利信息
表达式
雷达
正则化模型
增广拉格朗日
线性调频信号
放电控制方法
电容
微处理器
电生理特征
监控患者状态
视频编解码方法
深度神经网络
运动向量
编码树单元
卫星轨道参数
孪生神经网络
筛选方法
大语言模型
多模态
社会研究