一种大模型推理任务处理系统、方法及介质

正文

推荐专利

一种大模型推理任务处理系统、方法及介质

申请号：CN202510996024

申请日期：2025-07-18

公开号：CN120821574A

公开日期：2025-10-21

类型：发明专利

摘要

本申请提供了一种大模型推理任务处理系统、方法及介质，其中,事件封装模块通过预设事件封装规则将推理任务参数封装为结构化事件并将其存储至分布式消息队列，实现了任务请求与模型实例处理的异步解耦，提高了任务并发响应效率。其次，事件处理模块根据消息队列中的推理事件动态分配匹配的模型实例，基于事件负载实时调用资源，改变了静态资源池整卡独占或固定配额的分配模式，避免资源碎片化和争抢的问题。最后，资源预测模块通过分析历史资源消耗数据、事件资源需求特征、模型实例的资源消耗数据，提前预判下一阶段的资源需求并制定资源分配策略，使计算资源能够根据实际需求弹性伸缩，有效提高了计算资源的利用率。

技术关键词

分布式消息队列资源消耗预测资源分配策略状态监控模块资源分配模块配额封装模块神经网络模型数据资源占用状态反馈状态信息时序特征监控单元参数

系统为您推荐了相关专利信息

一种基于云计算的竞赛管理系统及方法

竞赛管理方法竞赛管理系统阶段服务器资源分配策略

优化建议的确定方法及装置、存储介质、电子装置

结构化查询语句资源分配策略电子装置计划智慧家庭技术

一种基于链上链下交互的通信网络及方法

网关单元 SDN交换机通信网络 SDN控制器数据处理模块

基于轻量级主干结构的戏曲舞台场景分割方法

场景分割方法非线性动力学模型舞台信息熵多尺度特征提取

基于大模型的智慧园区应急通信调度方法

通信调度方法博弈论模型资源分配策略情境感知机制元胞自动机模型

一种大模型推理任务处理系统、方法及介质

站点导航

APP 下载