一种实现大模型一体机资源使用及并发推理的方法及系统

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
推荐专利
一种实现大模型一体机资源使用及并发推理的方法及系统
申请号:CN202511460938
申请日期:2025-10-14
公开号:CN120930806A
公开日期:2025-11-11
类型:发明专利
摘要
本发明提供了一种实现大模型一体机资源使用及并发推理的方法及系统,包括结合大模型一体机使用场景,收集模型基础信息;依据评估结果制定差异化资源分配策略,规划隔离资源和共享资源;评估分类数据存储;优化模型推理引擎;定义核心监控指标;构建多维指标评价体系;参考模型指标评价结果,完成模型资源和参数的动态优化。本发明通过系统性的资源规划与管理设计,构建高效智能的资源调度体系,实现对大模型一体机资源的智能感知与精准调配。有力支撑资源使用合理性的准确评估,有效应对复杂多变的应用场景需求,显著提升大模型一体机的资源利用率与运行效率,为大模型一体机领域带来创新性的解决方案与显著的应用价值。
技术关键词
指标评价体系 梯度提升树 资源分配策略 数据生命周期管理 多模型 管理共享资源 场景 分层存储架构 业务质量指标 资源评估方法 性能监控 存储监控数据 硬件资源配置 采集器 数据压缩算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号