摘要
本发明涉及分布式大模型推理领域,具体涉及一种基于令牌感知与李雅普诺夫优化的分布式大模型推理方法。方案包括:接收用户输入提示后,通过长度感知语义模块预测对应任务的输出令牌长度,计算对应工作总量,基于令牌长度预测结果、设备实时状态与长期虚拟队列状态,通过李雅普诺夫引导卸载优化模块迭代卸载算法生成最终卸载决策;客户端根据最终卸载决策将任务卸载至对应的云边端设备,设备执行大模型推理;调度器根据实际任务执行时间与设备算力利用率,更新虚拟队列长度,为下一时隙决策提供输入。本发明适用于利用分布式大模型的推理系统。
技术关键词
李雅普诺夫优化
令牌
推理方法
卸载算法
设备实时状态
训练语言模型
决策
队列
语义向量
整数非线性规划
整数线性规划
调度器
校准机制
推理系统
矩阵
提示设备
带阻尼
客户端
系统为您推荐了相关专利信息
深度强化学习算法
Rician信道
功率控制方法
令牌
历史交互信息
模糊集合
推理方法
隶属度函数
模糊规则
模糊语义
图形操作
调度员
操作系统
设备实时状态
电网拓扑结构