基于大模型的高并发轻量级数据通道自适应负载均衡方法

AITNT
正文
推荐专利
基于大模型的高并发轻量级数据通道自适应负载均衡方法
申请号:CN202511475706
申请日期:2025-10-16
公开号:CN120980082B
公开日期:2025-12-26
类型:发明专利
摘要
本发明涉及分布式计算技术领域,尤其涉及一种基于大模型的高并发轻量级数据通道自适应负载均衡方法,该方法在当前LLM推理请求到达均衡负载器时,根据任一服务器的历史请求记录集合中每个历史请求与当前LLM推理请求的硬度相似性,对利用项进行初始优化,得到任一服务器处理当前LLM推理请求的初始优化利用项;构建预期残差补偿因子,利用预期残差补偿因子对初始优化利用项进行再次优化,得到最佳利用项;根据任一服务器的最佳利用项,得到任一服务器的决策得分,根据每个服务器的决策得分,对当前LLM推理请求进行自适应负载均衡,使得在长期运行中保持高效的负载均衡能力。
技术关键词
负载均衡方法 服务器 语义向量 因子 预测残差 决策 分布式计算技术 时效性 时间差 基准 分子
系统为您推荐了相关专利信息
1
基于机器视觉的工业元器件异常检测系统、方法及设备
元器件 异常检测装置 异常检测系统 服务器模块 前端模块
2
版面结构的识别方法、装置、设备及介质
语义向量 版面结构 字符 视觉 识别方法
3
多模态数据融合的电碳表碳排放监测方法及装置
多模态数据融合 监测方法 因子 能源 监测点
4
一种燃料合同智能审核方法及系统
智能审核方法 智能审核系统 指标 燃料 策略
5
一种音视频文件自动采集及认证传输方法、装置及介质
音视频存储设备 后台系统 对称加密算法 数据接口 数据传输接口
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号