一种大语言模型推理的算力评估与资源配置方法

AITNT
正文
推荐专利
一种大语言模型推理的算力评估与资源配置方法
申请号:CN202511076738
申请日期:2025-08-01
公开号:CN120950357A
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开了一种大语言模型推理的算力评估与资源配置方法,所述算力评估与资源配置方法包括:步骤S101:输入待评估的大语言模型;步骤S102:解析所述大语言模型,并识别虚拟算子;步骤S103:所述虚拟算子算力需求剖析;步骤S104:生成算力使用判定表;步骤S105:实时采集异构GPU池硬件能力,获得异构硬件能力参数;步骤S106:将所述异构硬件能力参数进行标准化处理;步骤S107:算力需求与硬件能力数学匹配;步骤S108:动态推荐并选择最佳适配硬件组合;步骤S109:根据推荐的最佳适配硬件组合启动大语言模型。通过一套动态评估机制,精确预测该模型所需的算力资源,并据此从异构GPU资源池中智能推荐并选择最适合的硬件组合。
技术关键词
资源配置方法 大语言模型 异构 系统实时监测 参数 数学 机器学习模型 动态 内存 沙箱 模式 功耗 数据 机制 能耗 指标 算法 序列 平台
系统为您推荐了相关专利信息
1
一种基于证据检索的可解释虚假新闻检测方法
文章 自然语言推理 文本 编码 两阶段
2
一种自动ICD编码方法和系统
编码方法 文本 商业模型 输出模块 大语言模型
3
一种基于卷积网络的异常流量监测方法及系统
数据特征提取 时序特征 监测方法 流量异常监测 网络
4
城市建筑微电网集群分布式低碳能源调度方法及系统
能源调度方法 增广拉格朗日 ADMM算法 建筑 集群
5
一种油井运行状态分析系统及方法
状态分析系统 随机森林 异常数据 灰狼优化算法 故障诊断模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号