基于GPU负荷信息的GPU分配方法及装置

AITNT
正文
推荐专利
基于GPU负荷信息的GPU分配方法及装置
申请号:CN202411023269
申请日期:2024-07-29
公开号:CN119179565A
公开日期:2024-12-24
类型:发明专利
摘要
本发明公开基于GPU负荷信息的GPU分配方法及装置,其方法包括接收GPU分配请求,所述GPU分配请求来自于AI计算算法服务;收集GPU信息,在收集GPU信息成功后解析所述GPU信息获得多个GPU的信息值及GPU index标识;根据所述多个GPU的信息值计算最小负荷的GPU,选择所述最小负荷的GPU的GPU index标识返回所述AI计算算法服务。本发明根据所述多个GPU的信息值计算最小负荷的GPU,选择所述最小负荷的GPU的GPU index标识返回所述AI计算算法服务,可避免随机选择导致GPU选择不合理,提升AI计算能力。
技术关键词
负荷 内存 标识 子模块 分配装置 总量 http请求 算法 处理器通信 可读存储介质 消息 存储器 计算机 电子设备 程序 指令 服务器
系统为您推荐了相关专利信息
1
一种数据实时备份安全防护系统及防护方法
备份 子模块 深度包检测技术 数据采集模块 数据传输监测
2
一种用于配微电网的多头多目标的算力调度方法
微服务实例 资源调度器 服务器 时延 内存
3
一种基于深度学习的电网作业现场人脸识别方法
电网作业现场 遮挡人脸图像 人脸识别方法 子模块 多层感知机
4
基于待测设计配置的芯片回归测试方法、电子设备和介质
标识 回归测试方法 状态更新 计算机可执行指令 进程
5
一种建筑装饰异型构件智能雕刻设备
智能雕刻设备 雕刻机械臂 雕刻平台 图像获取模块 中央控制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号