一种面向大模型并行处理的算力资源分配方法

AITNT
正文
推荐专利
一种面向大模型并行处理的算力资源分配方法
申请号:CN202411007127
申请日期:2024-07-25
公开号:CN118819858B
公开日期:2025-02-14
类型:发明专利
摘要
本申请涉及数据处理技术领域,具体涉及一种面向大模型并行处理的算力资源分配方法,该方法包括:获取每台算力设备中各历史计算任务的执行时长、计算结果、所需存储容量及每台算力设备的可存储容量;确定每台算力设备中各历史计算任务的执行效率;确定每台算力设备的长期重载运行能力;确定各计算任务的算力分配优先度,以对各计算任务分配算力资源。本申请基于计算任务和任意算力设备之间的算力分配概率,结合概率选择模型对计算任务分配算力资源,可降低算力资源分配时算力设备瘫痪的可能性,提高大模型训练的整体效率。
技术关键词
资源分配方法 表达式 损耗 工作量 数据处理技术 估计算法 数值 阶段
系统为您推荐了相关专利信息
1
一种防波堤防浪墙断面的参数分析优化方法
动态响应分析 防波堤 分析优化方法 风荷载 防浪墙
2
一种采样力度自适应的内燃机结构响应重构方法及系统
内燃机结构 重构方法 矩阵 表达式 模态分析
3
一种基于边界特征增强的三维网格孔洞修复方法
网格孔洞 边界特征 修复方法 顶点 面片
4
基于时频Transformer模型的低轨卫星通信信号识别方法
信号识别方法 深度学习模型 矩阵 数据 编码
5
一种一维二维同时诊断冲击波速度测量系统
反射镜 条纹相机 冲击波 二维速度场 分光模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号