一种显卡资源分配方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
一种显卡资源分配方法、装置、电子设备及存储介质
申请号:CN202410909822
申请日期:2024-07-09
公开号:CN118484312B
公开日期:2024-10-01
类型:发明专利
摘要
本发明实施例提供了一种显卡资源分配方法、装置、电子设备及存储介质,涉及计算机技术领域,具体实现方案为:获得各推理大模型的预测访问流量,其中,预测访问流量是:基于历史时间段中的对推理大模型执行推理任务的流量产生影响的因子获得的;针对每一推理大模型,根据该推理大模型对应的显卡资源量与访问流量的对应关系,确定该推理大模型需要的预测显卡资源的资源量,基于能够提供预测显卡资源的显卡数量为该推理大模型分配显卡资源;根据计算平台的剩余显卡数量和各训练微调大模型的训练微调优先级,为各个训练微调大模型分配显卡资源。应用本发明实施例提供的方案可以更合理地为各个大模型分配计算平台中的显卡资源。
技术关键词
显卡 时间段 语义特征 保留特征 资源分配模块 线性回归方程 因子 资源分配方法 输出特征 信息更新 内存 资源分配装置 通信接口 电子设备 关系 可读存储介质 存储器 处理器
系统为您推荐了相关专利信息
1
一种集成线路板的总成结构
集成线路板 总成结构 插条 显卡插槽 内存条插槽
2
对象推荐方法、对象推荐模型的训练方法和电子设备
相关性分析模型 对象推荐方法 时间段 操作界面 归一化模块
3
一种基于贪婪修复遗传算法的大规模电动汽车集群有序充电优化方法
充电优化方法 遗传算法 负荷 三相不平衡度 决策
4
调水工程水源区综合影响评估方法
调水工程 评价指标体系 模糊综合评价模型 模糊层次分析法 集成评价方法
5
海域开发适宜性评价方法及系统
编码向量 指标 评价系统 适宜性评价方法 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号