一种基于语义通信的大语言模型推理调度方法和装置

AITNT
正文
推荐专利
一种基于语义通信的大语言模型推理调度方法和装置
申请号:CN202511111753
申请日期:2025-08-08
公开号:CN120750491A
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种基于语义通信的大语言模型推理调度方法和装置,包括:边缘设备通过联合轻量模型提取推理请求的语义信息后预测输出token长度并上传至大语言模型服务器;大语言模型服务器根据语义调度评分函数对等待请求排序,评分函数基于token长度、信道质量和历史重传次数动态加权计算,选取优先级最高的请求组并指示对应的边缘设备上传由联合轻量模型提取的推理请求的语义张量;大语言模型服务器接收语义张量后重构信息进行批次推理。本发明能有效提升推理系统在高并发环境下的吞吐能力,降低任务响应时延,增强边缘语义通信系统的稳定性与服务质量,对大语言模型在边缘计算与多用户语义通信场景下的部署具有广泛适用性与推广价值。
技术关键词
大语言模型 通用编码器 通信基站 语义向量 服务器 推理系统 分布式边缘 平均等待时间 信道 动态 重构 残差模块 调度装置 表达式 监控模块 策略 标签
系统为您推荐了相关专利信息
1
基于时空特征的深度学习公交车到站时间预测方法
公交车到站时间 节点 站点 特征提取模块 路段
2
一种架桥机作业自动监控、预警及控制系统
作业自动监控 起重小车 远程服务器 人机交互模块 距离传感器
3
一种智能穿戴设备的LED显示屏控制模组
智能穿戴设备 数据处理芯片 控制模组 温度补偿电路 深度学习服务器
4
后备信号系统及列车运行控制方法
计轴设备 信号系统 列车运行控制方法 位置管理服务器 惯性导航传感器
5
融合感理性推理与心智记忆增强的情感支持对话生成方法
对话生成方法 记忆 线索 语义 多轮对话
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号