一种基于张量并行的资源分配方法及系统

正文

推荐专利

一种基于张量并行的资源分配方法及系统

申请号：CN202510174186

申请日期：2025-02-18

公开号：CN119645665B

公开日期：2025-06-13

类型：发明专利

摘要

本发明技术涉及大语言模型领域，具体而言，涉及一种基于张量并行的资源分配方法及系统，本发明解决的问题：如何在计算资源不足的情况下满足计算需求，并延长设备使用寿命的问题，为解决上述问题，本发明提供一种资源分配方法，包括：划分计算组，计算计算组的最优计算负荷和最大计算负荷；将子模块划分为张量模块或流水线模块，划分优先级；计算计算负荷量；计算通信效率；计算负荷余量；将子模块分配给各个计算组，得到计算资源分配规划；若当前负荷大于等于最大计算负荷，优先计算部分子模块，并将未被优先计算的子模块标记为待分配模块；将待分配模块分配给该计算组进行协助计算。

技术关键词

资源分配方法流水线模块子模块通信效率负荷资源分配系统规划延长设备使用寿命分层大语言模型标记数据功率

系统为您推荐了相关专利信息

资源分配方法、装置、电子设备及存储介质

资源分配请求资源分配方法共享图像时间差计算机执行指令

一种含熔盐储热的园区综合能源系统配置与运行优化方法

熔盐储热系统高温热泵蒸汽发生器园区综合能源系统制冷机

基于电碳耦合定价的电车充电方法、装置、介质和设备

电车充电方法负荷粒子群算法蒙特卡洛法动态

基于广义Benders算法的柔性互联配电网分布式供电恢复方法

分布式供电有功功率光伏发电机组换流器储能单元

面向园区级可调负荷的资源调控方法、装置、设备及介质

资源调控方法调控策略强化学习算法深度学习算法长短期记忆网络

一种基于张量并行的资源分配方法及系统

站点导航

APP 下载