摘要
本公开的实施例提供了一种信息处理方法、信息处理系统、电子设备和存储介质。该方法包括:获取第一节点中张量并行设备的第一数目以及第二节点中张量并行设备的第二数目,第一节点和第二节点分别用于执行同一推理任务的不同任务阶段,且任务阶段之间存在数据依赖关系,第一数目和第二数目不同;根据第一数目和第二数目,确定第一节点中每个张量并行设备需建立的通信组的第三数目;基于第三数目,为第一节点中每个张量并行设备建立通信组,以实现第一节点中张量并行设备和第二节点中张量并行设备间的通信。该方法能够支持异构部署场景下的模型加速推理,提升推理系统的兼容性、可扩展性及资源利用率。
技术关键词
信息处理方法
信息处理系统
数据依赖关系
节点
建立通信
计算机可读指令
阶段
电子设备
处理器
推理系统
可读存储介质
发送端
存储器
接收端
注意力
异构
解码
场景
资源