一种显卡资源分配方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202410909822

申请日期：2024-07-09

公开号：CN118484312B

公开日期：2024-10-01

类型：发明专利

摘要

本发明实施例提供了一种显卡资源分配方法、装置、电子设备及存储介质，涉及计算机技术领域，具体实现方案为：获得各推理大模型的预测访问流量，其中，预测访问流量是：基于历史时间段中的对推理大模型执行推理任务的流量产生影响的因子获得的；针对每一推理大模型，根据该推理大模型对应的显卡资源量与访问流量的对应关系，确定该推理大模型需要的预测显卡资源的资源量，基于能够提供预测显卡资源的显卡数量为该推理大模型分配显卡资源；根据计算平台的剩余显卡数量和各训练微调大模型的训练微调优先级，为各个训练微调大模型分配显卡资源。应用本发明实施例提供的方案可以更合理地为各个大模型分配计算平台中的显卡资源。

技术关键词

显卡时间段语义特征保留特征资源分配模块线性回归方程因子资源分配方法输出特征信息更新内存资源分配装置通信接口电子设备关系可读存储介质存储器处理器

系统为您推荐了相关专利信息

一种集成线路板的总成结构

集成线路板总成结构插条显卡插槽内存条插槽

对象推荐方法、对象推荐模型的训练方法和电子设备

相关性分析模型对象推荐方法时间段操作界面归一化模块

一种基于贪婪修复遗传算法的大规模电动汽车集群有序充电优化方法

充电优化方法遗传算法负荷三相不平衡度决策

调水工程水源区综合影响评估方法

调水工程评价指标体系模糊综合评价模型模糊层次分析法集成评价方法

海域开发适宜性评价方法及系统

编码向量指标评价系统适宜性评价方法数据

一种显卡资源分配方法、装置、电子设备及存储介质

站点导航

APP 下载