摘要
本发明提供了一种面向大模型应用的任务分发方法及系统,涉及资源调度技术领域,方法包括:使用消息队列分发不同类型的任务到请求分发器;使用用户配置的分组策略对同一类型的任务分组,得到不同的任务组;基于最优匹配算法将不同的任务组调度到执行组件进行执行。本发明进行多个大模型任务的调度,能够充分利用到大模型推理优化手段中最重要的批处理方法,能够有效管理部署在多个节点的大模型,能够根据不同的请求类型对大模型任务进行分发,能够高效地调度大模型执行具体任务,还支持拓展或减少大模型任务类型。
技术关键词
分发器
分发系统
队列
消息
任务调度器
策略
配置系统信息
资源调度技术
批处理方法
算法
网关
接口单元
存储单元
管理器
标识
序列
程序
主题
节点
系统为您推荐了相关专利信息
在线视觉检测方法
软件控制系统
机器视觉检测技术
多线程技术
控制相机拍照
语音识别模型
语音识别界面
信息显示装置
信息显示方法
关键词