一种面向大模型训练的GPU集群算力优化架构

AITNT
正文
推荐专利
一种面向大模型训练的GPU集群算力优化架构
申请号:CN202510495318
申请日期:2025-04-21
公开号:CN120448030A
公开日期:2025-08-08
类型:发明专利
摘要
一种面向大模型训练的GPU集群算力优化架构,算力资源管理模块用于实时监测并管理GPU集群中各GPU的算力资源状态,任务调度模块用于根据训练任务的需求分配GPU资源,算力优化模块用于在任务执行过程中对GPU集群的算力进行动态优化,结果反馈模块用于收集并分析优化后的算力使用情况,以调整后续的任务调度策略。本发明通过实时监测并管理GPU集群的算力资源状态,根据训练任务的需求动态分配GPU资源,并在任务执行过程中对GPU集群的算力进行动态优化,有效提高了GPU集群的算力利用效率,降低了训练成本。
技术关键词
集群 任务调度策略 任务调度算法 需求预测模型 故障预测模型 自定义任务调度 数据分析单元 预警模块 隐私保护机制 资源状态信息 分配单元 动态 支持多任务 高精度传感器 历史故障数据 监测单元
系统为您推荐了相关专利信息
1
一种应用于AI数据流处理的集群汇集通信系统
协方差矩阵 通信系统 异常事件 生成三维空间 拓扑网络
2
一种基于算力的网络安全监测方法及系统、电子设备
网络安全监测方法 多任务并行处理 关联分析算法 网络流量数据 系统日志
3
一种无人机电子对抗方法和装置、无人机及存储介质
电子对抗方法 无人机集群 检测无人机 动态 电子对抗装置
4
无人机集群协同的实景三维数据采集路径自主规划方法
无人机集群协同 实景三维数据 深度强化学习算法 通信链路优化 点云密度
5
基于时空约束近端策略优化的时变任务调度方法及系统
任务调度方法 掩码矩阵 LSTM模型 任务调度策略 任务调度系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号