摘要
本申请涉及数据处理技术领域,具体涉及一种面向大模型并行处理的算力资源分配方法,该方法包括:获取每台算力设备中各历史计算任务的执行时长、计算结果、所需存储容量及每台算力设备的可存储容量;确定每台算力设备中各历史计算任务的执行效率;确定每台算力设备的长期重载运行能力;确定各计算任务的算力分配优先度,以对各计算任务分配算力资源。本申请基于计算任务和任意算力设备之间的算力分配概率,结合概率选择模型对计算任务分配算力资源,可降低算力资源分配时算力设备瘫痪的可能性,提高大模型训练的整体效率。
技术关键词
资源分配方法
表达式
损耗
工作量
数据处理技术
估计算法
数值
阶段
系统为您推荐了相关专利信息
动态响应分析
防波堤
分析优化方法
风荷载
防浪墙