摘要
本申请公开了一种模型推理服务弹性负载预测方法、设备及介质,属于弹性负载预测技术领域。方法包括:基于所述Kubernetes平台的Prometheus采集所述模型推理服务的运行数据;清洗并整理所述运行数据,以生成标准运行数据;构建基于transformer的时序预测模型;基于所述时序预测模型处理所述标准运行数据,以生成预设时间段的负载预测;将设时间段的负载预测输送至所述Kubernetes平台的HPA,并基于所述HPA调整所述模型推理服务的负载数量。本申请通过上述方法实现了更精准地预测负载变化,减少人工干预和运维成本,更加智能化的资源调度的技术效果。
技术关键词
时序预测模型
负载预测方法
时间段
数据
计算机可执行指令
负载预测技术
初始化算法
线性插值法
计算机存储介质
告警规则
验证算法
编码
内存
处理器通信
存储器
训练集
注意力
平台
系统为您推荐了相关专利信息
度评估方法
声纹特征
噪声谱估计
频域去噪
关系型数据库
推荐系统
电梯
视频
AdaBoost算法
食品店铺
采集器
地质监测仪
语义特征提取
NoSQL数据库
资源
运动控制系统
自然语言
验证方法
知识图谱数据库
三维仿真模型