多元算力推理装置、方法、电子设备、程序及存储介质

AITNT
正文
推荐专利
多元算力推理装置、方法、电子设备、程序及存储介质
申请号:CN202510796943
申请日期:2025-06-16
公开号:CN120315897B
公开日期:2025-10-21
类型:发明专利
摘要
本申请公开了一种多元算力推理装置、方法、电子设备、程序及存储介质,应用于模型推理技术领域,包括:控制单元用于读取推理模型的模型参数并载入至第一资源组和第二资源组,接收推理请求并发送至第一资源组;第一加速卡的算力大于第二加速卡的算力,第二加速卡的带宽大于第一加速卡的带宽;第一资源组用于通过自身的各张第一加速卡,执行预填充运算,并将运算结果通过加速器互联交换机发送至第二资源组;第二资源组用于通过自身的各张第二加速卡,执行针对推理请求的解码运算,得到针对推理请求的推理结果,解决了资源的利用率不高的技术问题,达到了实现高效的推理,提高资源利用率的技术效果。
技术关键词
加速卡 资源组 推理装置 加速器 交换机 中央处理器 推理方法 控制单元 解码 容器 参数 推理技术 电子设备 可读存储介质 存储计算机程序 计算机程序产品 存储设备
系统为您推荐了相关专利信息
1
资源分配系统、方法、电子设备及计算机可读存储介质
资源分配系统 调度器 节点 资源分配方法 GPU虚拟化
2
基于自适应利用率的存内计算加速器、系统及方法
静态随机存取存储器 加速器 神经网络计算方法 数据处理器 数据处理系统
3
一种测斜机器人用的自动停机报警机构
报警机构 传感器探头 报警主机 重力传感器 传感组件
4
基于双处理器异构平台的太赫兹雷达实时成像装置及方法
异构平台 信号处理机 实时成像装置 实时成像方法 射频前端模块
5
拥塞控制算法的性能测试方法及相关设备
拥塞控制算法 节点 命令 队列 性能测试方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号