摘要
本申请提供一种模型推理方法、装置、设备、计算机可读存储介质及产品,该方法包括:确定第一模型的N个模型主干和N个模型分支;其中,N为大于或者等于2的整数;通过推理单元对每个模型主干分别进行推理,并通过中央处理单元对每个模型分支分别进行推理及后处理;其中,第i个模型主干的推理与第i‑1个模型分支的推理并行进行;i为大于或者等于2的整数;本申请实施例将第一模型的所有节点拆分为多个模型主干和多个模型分支,模型主干的推理和模型分支的推理分别在推理单元和中央处理单元并行运行,提高了模型推理的并行度,从而实现了更快的推理速度、更低的延迟以及更好的用户体验。
技术关键词
节点
分支
推理方法
处理单元
有向无环图
变量
查询模型
电子设备
可读存储介质
推理装置
处理器
计算机程序产品
存储器
指令
参数
内存
模块
速度
系统为您推荐了相关专利信息
无人机航拍图像
语义分割方法
训练特征
语义分割模型
三元组损失函数
资源调度策略
动态服务网络
节点
资源调度模型
深度强化学习
组合模块
动态跟踪方法
网络
多尺寸
匈牙利匹配算法
节点
同态加密算法
镜像
计算机程序指令
数据处理方法