摘要
本发明公开了一种大语言模型推理的算力评估与资源配置方法,所述算力评估与资源配置方法包括:步骤S101:输入待评估的大语言模型;步骤S102:解析所述大语言模型,并识别虚拟算子;步骤S103:所述虚拟算子算力需求剖析;步骤S104:生成算力使用判定表;步骤S105:实时采集异构GPU池硬件能力,获得异构硬件能力参数;步骤S106:将所述异构硬件能力参数进行标准化处理;步骤S107:算力需求与硬件能力数学匹配;步骤S108:动态推荐并选择最佳适配硬件组合;步骤S109:根据推荐的最佳适配硬件组合启动大语言模型。通过一套动态评估机制,精确预测该模型所需的算力资源,并据此从异构GPU资源池中智能推荐并选择最适合的硬件组合。
技术关键词
资源配置方法
大语言模型
异构
系统实时监测
参数
数学
机器学习模型
动态
内存
沙箱
模式
功耗
数据
机制
能耗
指标
算法
序列
平台
系统为您推荐了相关专利信息
数据特征提取
时序特征
监测方法
流量异常监测
网络
能源调度方法
增广拉格朗日
ADMM算法
建筑
集群
状态分析系统
随机森林
异常数据
灰狼优化算法
故障诊断模块