摘要
本申请涉及一种GPU资源的负载均衡方法、装置和计算机设备,涉及云计算技术领域。所述方法包括:响应于GPU资源使用方发起的GPU实例调用请求,从预配置的GPU集群中获取各GPU实例的实例地址;根据各GPU实例的实例地址,查询得到各GPU实例的元数据,检测得到各GPU实例的负载情况描述数据;根据元数据和负载情况描述数据,从GPU集群中筛选得到符合条件的GPU实例作为目标实例,将目标实例的实例地址作为GPU实例调用请求的响应发送至GPU资源使用方,以供GPU资源使用方调用目标实例的计算资源。采用本方法能够改善GPU实例资源进行负载均衡的效果。
技术关键词
分布式存储系统
集群
负载均衡方法
资源
计算机设备
云计算技术
计算机程序产品
处理器
数据更新
可读存储介质
存储器
方针
接口
物理
系统为您推荐了相关专利信息
智能体系统
量子优化算法
应急决策方法
动态反馈机制
区块链智能合约
卫星云图
深度学习预测模型
多源卫星数据
智能融合方法
卡尔曼滤波
垃圾收集
垃圾中转站
垃圾处理站
任务调度方法
拓扑图