基于预分配锁内存的计算卡群并行推理方法及装置

AITNT
正文
推荐专利
基于预分配锁内存的计算卡群并行推理方法及装置
申请号:CN202510340910
申请日期:2025-03-21
公开号:CN120315863A
公开日期:2025-07-15
类型:发明专利
摘要
本发明提出一种基于预分配锁内存的计算卡群并行推理方法和装置,包括:构建由多张智能计算卡构成的智能计算卡群;获取推理请求,推理请求包含待推理的模型参数、输入数据以及其他的请求元数据信息;在每张智能计算卡的内存区域内划分锁内存区域;根据当前智能计算卡的空闲显存,在隐藏维度上切分输入数据,得到多个子张量;每个智能计算卡执行分配到的子张量的推理任务,然后各加速卡协同完成推理任务,各加速卡将得到的推理结果作为中间结果保存至本地的锁内存区域;当智能计算卡群完成全部子张量的推理任务后,按照正确的顺序进行合并所有智能计算卡的锁内存区域中的中间结果,得到推理请求的推理结果。
技术关键词
并行推理方法 加速卡 内存 推理装置 信息显示设备 人工智能模型 参数 数据 计算机程序产品 分发模块 电子设备 资源 可读存储介质 处理器 动态 客户端
系统为您推荐了相关专利信息
1
无同步ILU预条件子的CFD高效GPU计算方法
GPU计算方法 关系 大规模非结构 高性能并行计算 索引
2
一种基于异构算力的接入管理系统和方法
接入管理系统 机器学习模型 异构 阈值机制 资源监控
3
一种电气控制柜BOM的生成方法、计算机设备及介质
电气控制柜 生成方法 神经网络模型 数据库缓存技术 关键词
4
一种开盖检测系统及方法
气压传感器 金属外壳 单片机 开盖检测系统 存储器
5
一种扩膜机构及内存条主控芯片固晶机
固晶机 升降模块 作业机台 主控芯片 扩膜机构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号