摘要
本公开涉及基于流量分流的大模型资源优化的方法、装置、电子设备以及计算机可读介质。基于流量分流的大模型资源优化的方法,包括:实时监测包括关键指标的流量数据,其中,关键指标包括请求队列长度、响应时间和资源利用率中的一项或多项;通过多层次时间序列模型基于流量数据进行流量预测;当监测到流量达到流量阈值或预测到流量要达到流量阈值时,确定请求的优先级;以及根据请求的优先级向不同的资源池分配不同的请求。
技术关键词
时间序列模型
资源
多层次
生成时间序列数据
事件特征
流量监测模块
服务等级协议
指标
电子设备
生成业务
队列
复杂度
程序
计算机
处理器
分阶段
介质
日历
系统为您推荐了相关专利信息
建议生成方法
变电站设备
变电站故障诊断技术
设备间共享资源
文本特征向量
波束资源分配方法
通信量
小区
最大化系统
低轨卫星系统
企业人力资源管理
校准方法
大数据
特征匹配算法
资源配置优化
参数配置方法
需求预测模型
参数配置系统
智能优化算法
机器学习算法