一种大模型推理任务处理系统、方法及介质

AITNT
正文
推荐专利
一种大模型推理任务处理系统、方法及介质
申请号:CN202510996024
申请日期:2025-07-18
公开号:CN120821574A
公开日期:2025-10-21
类型:发明专利
摘要
本申请提供了一种大模型推理任务处理系统、方法及介质,其中,事件封装模块通过预设事件封装规则将推理任务参数封装为结构化事件并将其存储至分布式消息队列,实现了任务请求与模型实例处理的异步解耦,提高了任务并发响应效率。其次,事件处理模块根据消息队列中的推理事件动态分配匹配的模型实例,基于事件负载实时调用资源,改变了静态资源池整卡独占或固定配额的分配模式,避免资源碎片化和争抢的问题。最后,资源预测模块通过分析历史资源消耗数据、事件资源需求特征、模型实例的资源消耗数据,提前预判下一阶段的资源需求并制定资源分配策略,使计算资源能够根据实际需求弹性伸缩,有效提高了计算资源的利用率。
技术关键词
分布式消息队列 资源消耗预测 资源分配策略 状态监控模块 资源分配模块 配额 封装模块 神经网络模型 数据 资源占用状态 反馈状态信息 时序特征 监控单元 参数
系统为您推荐了相关专利信息
1
一种基于云计算的竞赛管理系统及方法
竞赛管理方法 竞赛管理系统 阶段 服务器 资源分配策略
2
优化建议的确定方法及装置、存储介质、电子装置
结构化查询语句 资源分配策略 电子装置 计划 智慧家庭技术
3
一种基于链上链下交互的通信网络及方法
网关单元 SDN交换机 通信网络 SDN控制器 数据处理模块
4
基于轻量级主干结构的戏曲舞台场景分割方法
场景分割方法 非线性动力学模型 舞台 信息熵 多尺度特征提取
5
基于大模型的智慧园区应急通信调度方法
通信调度方法 博弈论模型 资源分配策略 情境感知机制 元胞自动机模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号