一种基于cpu+gpu的张量并行计算大模型的算法

正文

推荐专利

申请号：CN202510862336

申请日期：2025-06-25

公开号：CN120743525A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种基于cpu+gpu的张量并行计算大模型的算法，包括以下步骤：S1、采用混合维度的张量切分方式，对模型中的线性层结合行并行和列并行，并根据模型结构和硬件资源动态调整切分比例；S2、构建CPU与GPU协同计算机制，将部分对显存需求大且计算相对简单的任务分配给CPU，GPU负责计算密集型任务，优化CPU‑GPU之间的通信，实现CPU‑GPU通信和GPU计算的重叠；S3、实施动态资源分配与负载均衡策略，实时监测CPU和GPU的负载情况，根据模型不同层的计算需求和硬件资源的使用情况，动态调整任务分配，并采用自适应的批处理大小调整策略。本发明显著减少显存占用，降低通信成本，提高计算资源利用率。

技术关键词

协同计算机动态资源分配负载均衡策略通信等待时间环形算法通信链路矩阵缓存机制通信带宽线性节点数据内存下轮网卡分片总量

系统为您推荐了相关专利信息

一种基于低轨卫星网络的高速数据传输方法

高速数据传输方法低轨卫星网络星载传感器动态资源分配极化码级联

一种基于统一建模的多维数据关联分析的系统及方法

查询意图计划语义物理动态资源分配

一种无人平台多模遥感与多处理任务自主优化调度方法

优化调度方法无人平台动态资源分配副本网络文件系统

应用于混合云环境下的任务调度方法

混合云环境任务调度方法任务调度模型任务调度策略故障恢复策略

一种紧凑型PLC控制器功能模块

PLC控制器功能模块加速器控制策略通信单元

一种基于cpu+gpu的张量并行计算大模型的算法

站点导航

APP 下载