一种基于cpu+gpu的张量并行计算大模型的算法

AITNT
正文
推荐专利
一种基于cpu+gpu的张量并行计算大模型的算法
申请号:CN202510862336
申请日期:2025-06-25
公开号:CN120743525A
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种基于cpu+gpu的张量并行计算大模型的算法,包括以下步骤:S1、采用混合维度的张量切分方式,对模型中的线性层结合行并行和列并行,并根据模型结构和硬件资源动态调整切分比例;S2、构建CPU与GPU协同计算机制,将部分对显存需求大且计算相对简单的任务分配给CPU,GPU负责计算密集型任务,优化CPU‑GPU之间的通信,实现CPU‑GPU通信和GPU计算的重叠;S3、实施动态资源分配与负载均衡策略,实时监测CPU和GPU的负载情况,根据模型不同层的计算需求和硬件资源的使用情况,动态调整任务分配,并采用自适应的批处理大小调整策略。本发明显著减少显存占用,降低通信成本,提高计算资源利用率。
技术关键词
协同计算机 动态资源分配 负载均衡策略 通信等待时间 环形算法 通信链路 矩阵 缓存机制 通信带宽 线性 节点 数据 内存 下轮 网卡 分片 总量
系统为您推荐了相关专利信息
1
一种基于低轨卫星网络的高速数据传输方法
高速数据传输方法 低轨卫星网络 星载传感器 动态资源分配 极化码级联
2
一种基于统一建模的多维数据关联分析的系统及方法
查询意图 计划 语义 物理 动态资源分配
3
一种无人平台多模遥感与多处理任务自主优化调度方法
优化调度方法 无人平台 动态资源分配 副本 网络文件系统
4
应用于混合云环境下的任务调度方法
混合云环境 任务调度方法 任务调度模型 任务调度策略 故障恢复策略
5
一种紧凑型PLC控制器功能模块
PLC控制器 功能模块 加速器 控制策略 通信单元
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号