摘要
本发明技术涉及大语言模型领域,具体而言,涉及一种基于张量并行的资源分配方法及系统,本发明解决的问题:如何在计算资源不足的情况下满足计算需求,并延长设备使用寿命的问题,为解决上述问题,本发明提供一种资源分配方法,包括:划分计算组,计算计算组的最优计算负荷和最大计算负荷;将子模块划分为张量模块或流水线模块,划分优先级;计算计算负荷量;计算通信效率;计算负荷余量;将子模块分配给各个计算组,得到计算资源分配规划;若当前负荷大于等于最大计算负荷,优先计算部分子模块,并将未被优先计算的子模块标记为待分配模块;将待分配模块分配给该计算组进行协助计算。
技术关键词
资源分配方法
流水线模块
子模块
通信效率
负荷
资源分配系统
规划
延长设备使用寿命
分层
大语言模型
标记
数据
功率
系统为您推荐了相关专利信息
资源分配请求
资源分配方法
共享图像
时间差
计算机执行指令
熔盐储热系统
高温热泵
蒸汽发生器
园区综合能源系统
制冷机
分布式供电
有功功率
光伏发电机组
换流器
储能单元
资源调控方法
调控策略
强化学习算法
深度学习算法
长短期记忆网络