一种大语言模型应用工作负载的调度方法、系统及设备

正文

推荐专利

申请号：CN202511276990

申请日期：2025-09-09

公开号：CN120803669A

公开日期：2025-10-17

类型：发明专利

摘要

本申请提供了一种大语言模型应用工作负载的调度方法、系统及设备，涉及模型负载调度技术领域，该方法包括：将复合大语言模型应用建模为包含常规阶段、LLM阶段及动态阶段的有向无环图；通过贝叶斯网络建模有向无环图中各阶段间的执行相关性，动态预测未完成阶段的时长分布，结合LLM执行器的实时批处理大小对LLM阶段的时长预估值进行校准；基于信息熵量化调度各就绪阶段的不确定性减少量；采用ε‑greedy策略，结合JCT优先队列与不确定性缩减优先队列分配调度资源；将任务分派至对应执行器执行，重复上述过程直至所有作业完成。解决了现有技术中调度技术难以有效应对复合LLM应用的执行时间不确定性与结构不确定性的技术问题。

技术关键词

阶段大语言模型贝叶斯网络建模信息熵执行器队列动态概率分布建模校准策略解码资源调度系统模块定义变量计算机电子设备索引

系统为您推荐了相关专利信息

一种基于多源信息融合的光斑定位方法及系统

光斑定位方法多源信息融合光斑位置信息光斑中心坐标探测器

自动化流程生成方法、智能体及自动化流程生成系统

大语言模型自然语言生成方法装配模块生成系统

一种用于3D打印机的数据处理方法及系统

打印机数据处理方法打印产品标识数据处理设备阶段

芯片的数据压缩方法、装置、设备及存储介质

压缩编码数据数据压缩算法信息熵 Huffman编码数据压缩方法

一种基于双阶段密集检索的知识图谱关系抽取方法

自然语言交互特征阶段表达式注意力机制

一种大语言模型应用工作负载的调度方法、系统及设备

站点导航

APP 下载