摘要
本申请公开了一种多元算力推理装置、方法、电子设备、程序及存储介质,应用于模型推理技术领域,包括:控制单元用于读取推理模型的模型参数并载入至第一资源组和第二资源组,接收推理请求并发送至第一资源组;第一加速卡的算力大于第二加速卡的算力,第二加速卡的带宽大于第一加速卡的带宽;第一资源组用于通过自身的各张第一加速卡,执行预填充运算,并将运算结果通过加速器互联交换机发送至第二资源组;第二资源组用于通过自身的各张第二加速卡,执行针对推理请求的解码运算,得到针对推理请求的推理结果,解决了资源的利用率不高的技术问题,达到了实现高效的推理,提高资源利用率的技术效果。
技术关键词
加速卡
资源组
推理装置
加速器
交换机
中央处理器
推理方法
控制单元
解码
容器
参数
推理技术
电子设备
可读存储介质
存储计算机程序
计算机程序产品
存储设备
系统为您推荐了相关专利信息
资源分配系统
调度器
节点
资源分配方法
GPU虚拟化
静态随机存取存储器
加速器
神经网络计算方法
数据处理器
数据处理系统
报警机构
传感器探头
报警主机
重力传感器
传感组件
异构平台
信号处理机
实时成像装置
实时成像方法
射频前端模块