一种实现大模型一体机资源使用及并发推理的方法及系统

AITNT
正文
推荐专利
一种实现大模型一体机资源使用及并发推理的方法及系统
申请号:CN202511460938
申请日期:2025-10-14
公开号:CN120930806A
公开日期:2025-11-11
类型:发明专利
摘要
本发明提供了一种实现大模型一体机资源使用及并发推理的方法及系统,包括结合大模型一体机使用场景,收集模型基础信息;依据评估结果制定差异化资源分配策略,规划隔离资源和共享资源;评估分类数据存储;优化模型推理引擎;定义核心监控指标;构建多维指标评价体系;参考模型指标评价结果,完成模型资源和参数的动态优化。本发明通过系统性的资源规划与管理设计,构建高效智能的资源调度体系,实现对大模型一体机资源的智能感知与精准调配。有力支撑资源使用合理性的准确评估,有效应对复杂多变的应用场景需求,显著提升大模型一体机的资源利用率与运行效率,为大模型一体机领域带来创新性的解决方案与显著的应用价值。
技术关键词
指标评价体系 梯度提升树 资源分配策略 数据生命周期管理 多模型 管理共享资源 场景 分层存储架构 业务质量指标 资源评估方法 性能监控 存储监控数据 硬件资源配置 采集器 数据压缩算法
系统为您推荐了相关专利信息
1
一种基于NLP的电力需求预测与知识检索方法及设备
电力需求预测 知识检索方法 语句 门控神经网络 模型库
2
基于多模型协同对话的大模型交互方法及系统
协作策略 矩阵 高频特征 主成分分析算法 多模型协同
3
智能市政污水资源化利用决策支持方法及其系统
不确定性模型 实时监测数据 智能市政 决策支持方法 历史运行数据
4
一种基于无线边缘网络的多维资源管理联合优化方法
资源分配策略 联合优化方法 资源状态信息 节点 指标
5
用于预测5G网络切片或小区的资源使用的机器学习系统
机器学习系统 计算机网络系统 计算机网络方法 小区 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号