基于令牌感知与李雅普诺夫优化的分布式大模型推理方法

AITNT
正文
推荐专利
基于令牌感知与李雅普诺夫优化的分布式大模型推理方法
申请号:CN202511564148
申请日期:2025-10-30
公开号:CN121031801A
公开日期:2025-11-28
类型:发明专利
摘要
本发明涉及分布式大模型推理领域,具体涉及一种基于令牌感知与李雅普诺夫优化的分布式大模型推理方法。方案包括:接收用户输入提示后,通过长度感知语义模块预测对应任务的输出令牌长度,计算对应工作总量,基于令牌长度预测结果、设备实时状态与长期虚拟队列状态,通过李雅普诺夫引导卸载优化模块迭代卸载算法生成最终卸载决策;客户端根据最终卸载决策将任务卸载至对应的云边端设备,设备执行大模型推理;调度器根据实际任务执行时间与设备算力利用率,更新虚拟队列长度,为下一时隙决策提供输入。本发明适用于利用分布式大模型的推理系统。
技术关键词
李雅普诺夫优化 令牌 推理方法 卸载算法 设备实时状态 训练语言模型 决策 队列 语义向量 整数非线性规划 整数线性规划 调度器 校准机制 推理系统 矩阵 提示设备 带阻尼 客户端
系统为您推荐了相关专利信息
1
一种基于时延测量的大模型自适应批量推理系统及方法
时延 推理系统 批量 阶段 推理方法
2
基于张量并行处理的数字孪生水利大语言模型推理方法
大语言模型 推理方法 数字孪生 矩阵 节点
3
基于循环Flash强化学习的动态频谱与功率控制方法
深度强化学习算法 Rician信道 功率控制方法 令牌 历史交互信息
4
基于模糊控制的视频增强推理方法、装置、设备及介质
模糊集合 推理方法 隶属度函数 模糊规则 模糊语义
5
一种操作票安全校核及防误操作系统
图形操作 调度员 操作系统 设备实时状态 电网拓扑结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号