摘要
本发明公开了一种基于cpu+gpu的张量并行计算大模型的算法,包括以下步骤:S1、采用混合维度的张量切分方式,对模型中的线性层结合行并行和列并行,并根据模型结构和硬件资源动态调整切分比例;S2、构建CPU与GPU协同计算机制,将部分对显存需求大且计算相对简单的任务分配给CPU,GPU负责计算密集型任务,优化CPU‑GPU之间的通信,实现CPU‑GPU通信和GPU计算的重叠;S3、实施动态资源分配与负载均衡策略,实时监测CPU和GPU的负载情况,根据模型不同层的计算需求和硬件资源的使用情况,动态调整任务分配,并采用自适应的批处理大小调整策略。本发明显著减少显存占用,降低通信成本,提高计算资源利用率。
技术关键词
协同计算机
动态资源分配
负载均衡策略
通信等待时间
环形算法
通信链路
矩阵
缓存机制
通信带宽
线性
节点
数据
内存
下轮
网卡
分片
总量
系统为您推荐了相关专利信息
高速数据传输方法
低轨卫星网络
星载传感器
动态资源分配
极化码级联
优化调度方法
无人平台
动态资源分配
副本
网络文件系统
混合云环境
任务调度方法
任务调度模型
任务调度策略
故障恢复策略
PLC控制器
功能模块
加速器
控制策略
通信单元