一种基于语义通信的大语言模型推理调度方法和装置

正文

推荐专利

申请号：CN202511111753

申请日期：2025-08-08

公开号：CN120750491A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种基于语义通信的大语言模型推理调度方法和装置，包括：边缘设备通过联合轻量模型提取推理请求的语义信息后预测输出token长度并上传至大语言模型服务器；大语言模型服务器根据语义调度评分函数对等待请求排序，评分函数基于token长度、信道质量和历史重传次数动态加权计算，选取优先级最高的请求组并指示对应的边缘设备上传由联合轻量模型提取的推理请求的语义张量；大语言模型服务器接收语义张量后重构信息进行批次推理。本发明能有效提升推理系统在高并发环境下的吞吐能力，降低任务响应时延，增强边缘语义通信系统的稳定性与服务质量，对大语言模型在边缘计算与多用户语义通信场景下的部署具有广泛适用性与推广价值。

技术关键词

大语言模型通用编码器通信基站语义向量服务器推理系统分布式边缘平均等待时间信道动态重构残差模块调度装置表达式监控模块策略标签

系统为您推荐了相关专利信息

基于时空特征的深度学习公交车到站时间预测方法

公交车到站时间节点站点特征提取模块路段

一种架桥机作业自动监控、预警及控制系统

作业自动监控起重小车远程服务器人机交互模块距离传感器

一种智能穿戴设备的LED显示屏控制模组

智能穿戴设备数据处理芯片控制模组温度补偿电路深度学习服务器

后备信号系统及列车运行控制方法

计轴设备信号系统列车运行控制方法位置管理服务器惯性导航传感器

融合感理性推理与心智记忆增强的情感支持对话生成方法

对话生成方法记忆线索语义多轮对话

一种基于语义通信的大语言模型推理调度方法和装置

站点导航

APP 下载