一种端边云协同的语言模型分布式推理方法

正文

推荐专利

一种端边云协同的语言模型分布式推理方法

申请号：CN202510529584

申请日期：2025-04-25

公开号：CN120509498A

公开日期：2025-08-19

类型：发明专利

摘要

本发明提供了一种端边云协同的语言模型分布式推理方法，该方法包括：针对多种语言模型对应的推理任务，收集各设备处理语言模型的每层的推理时间、每层的输出数据量、每层的资源开销，以及获取各设备的可用资源和网络带宽；在未达到预定的要求时，采用静态的调度机制确定的卸载设备向其可调度设备卸载推理任务的指定关系；在达到预定的要求时，启用动态的调度机制，以最大化多个推理任务的估计平均节约时间为优化目标，优化各推理任务被调度到其可调度设备的比例，得到每个推理任务的调度决策；获取包含各推理任务的调度决策的任务列表，选择性地调整任务列表中任务的执行顺序以平衡地利用每个可调度设备的资源。

技术关键词

调度设备分布式推理方法资源列表遗传算法决策任务调度机制指标计算机程序产品处理器关系指令动态可读存储介质存储器电子设备队列总量

一种端边云协同的语言模型分布式推理方法

站点导航

APP 下载