摘要
本申请提供了一种大模型推理任务处理系统、方法及介质,其中,事件封装模块通过预设事件封装规则将推理任务参数封装为结构化事件并将其存储至分布式消息队列,实现了任务请求与模型实例处理的异步解耦,提高了任务并发响应效率。其次,事件处理模块根据消息队列中的推理事件动态分配匹配的模型实例,基于事件负载实时调用资源,改变了静态资源池整卡独占或固定配额的分配模式,避免资源碎片化和争抢的问题。最后,资源预测模块通过分析历史资源消耗数据、事件资源需求特征、模型实例的资源消耗数据,提前预判下一阶段的资源需求并制定资源分配策略,使计算资源能够根据实际需求弹性伸缩,有效提高了计算资源的利用率。
技术关键词
分布式消息队列
资源消耗预测
资源分配策略
状态监控模块
资源分配模块
配额
封装模块
神经网络模型
数据
资源占用状态
反馈状态信息
时序特征
监控单元
参数
系统为您推荐了相关专利信息
竞赛管理方法
竞赛管理系统
阶段
服务器
资源分配策略
结构化查询语句
资源分配策略
电子装置
计划
智慧家庭技术
网关单元
SDN交换机
通信网络
SDN控制器
数据处理模块
场景分割方法
非线性动力学模型
舞台
信息熵
多尺度特征提取
通信调度方法
博弈论模型
资源分配策略
情境感知机制
元胞自动机模型