一种面向大模型应用的任务分发方法及系统

AITNT
正文
推荐专利
一种面向大模型应用的任务分发方法及系统
申请号:CN202410970947
申请日期:2024-07-19
公开号:CN118939395A
公开日期:2024-11-12
类型:发明专利
摘要
本发明提供了一种面向大模型应用的任务分发方法及系统,涉及资源调度技术领域,方法包括:使用消息队列分发不同类型的任务到请求分发器;使用用户配置的分组策略对同一类型的任务分组,得到不同的任务组;基于最优匹配算法将不同的任务组调度到执行组件进行执行。本发明进行多个大模型任务的调度,能够充分利用到大模型推理优化手段中最重要的批处理方法,能够有效管理部署在多个节点的大模型,能够根据不同的请求类型对大模型任务进行分发,能够高效地调度大模型执行具体任务,还支持拓展或减少大模型任务类型。
技术关键词
分发器 分发系统 队列 消息 任务调度器 策略 配置系统信息 资源调度技术 批处理方法 算法 网关 接口单元 存储单元 管理器 标识 序列 程序 主题 节点
系统为您推荐了相关专利信息
1
基于内存逆向分析的即时会议取证方法与装置
会议 内存 取证方法 进程 取证工具
2
一种双工位的在线视觉检测方法及系统
在线视觉检测方法 软件控制系统 机器视觉检测技术 多线程技术 控制相机拍照
3
基于全量过车数据的路口信号控制效果评价方法及系统
路口信号控制 评价方法 队列模型 周期 统计方法
4
会话处理方法、设备、存储介质及程序产品
意图 历史会话 客服 大语言模型 消息
5
信息显示方法及装置
语音识别模型 语音识别界面 信息显示装置 信息显示方法 关键词
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号