一种大语言模型应用工作负载的调度方法、系统及设备

AITNT
正文
推荐专利
一种大语言模型应用工作负载的调度方法、系统及设备
申请号:CN202511276990
申请日期:2025-09-09
公开号:CN120803669A
公开日期:2025-10-17
类型:发明专利
摘要
本申请提供了一种大语言模型应用工作负载的调度方法、系统及设备,涉及模型负载调度技术领域,该方法包括:将复合大语言模型应用建模为包含常规阶段、LLM阶段及动态阶段的有向无环图;通过贝叶斯网络建模有向无环图中各阶段间的执行相关性,动态预测未完成阶段的时长分布,结合LLM执行器的实时批处理大小对LLM阶段的时长预估值进行校准;基于信息熵量化调度各就绪阶段的不确定性减少量;采用ε‑greedy策略,结合JCT优先队列与不确定性缩减优先队列分配调度资源;将任务分派至对应执行器执行,重复上述过程直至所有作业完成。解决了现有技术中调度技术难以有效应对复合LLM应用的执行时间不确定性与结构不确定性的技术问题。
技术关键词
阶段 大语言模型 贝叶斯网络建模 信息熵 执行器 队列 动态 概率分布建模 校准 策略 解码 资源 调度系统 模块 定义 变量 计算机 电子设备 索引
系统为您推荐了相关专利信息
1
一种基于多源信息融合的光斑定位方法及系统
光斑定位方法 多源信息融合 光斑位置信息 光斑中心坐标 探测器
2
自动化流程生成方法、智能体及自动化流程生成系统
大语言模型 自然语言 生成方法 装配模块 生成系统
3
一种用于3D打印机的数据处理方法及系统
打印机 数据处理方法 打印产品标识 数据处理设备 阶段
4
芯片的数据压缩方法、装置、设备及存储介质
压缩编码数据 数据压缩算法 信息熵 Huffman编码 数据压缩方法
5
一种基于双阶段密集检索的知识图谱关系抽取方法
自然语言 交互特征 阶段 表达式 注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号