一种模型推理服务弹性负载预测方法、设备及介质

AITNT
正文
推荐专利
一种模型推理服务弹性负载预测方法、设备及介质
申请号:CN202510121754
申请日期:2025-01-26
公开号:CN119938481A
公开日期:2025-05-06
类型:发明专利
摘要
本申请公开了一种模型推理服务弹性负载预测方法、设备及介质,属于弹性负载预测技术领域。方法包括:基于所述Kubernetes平台的Prometheus采集所述模型推理服务的运行数据;清洗并整理所述运行数据,以生成标准运行数据;构建基于transformer的时序预测模型;基于所述时序预测模型处理所述标准运行数据,以生成预设时间段的负载预测;将设时间段的负载预测输送至所述Kubernetes平台的HPA,并基于所述HPA调整所述模型推理服务的负载数量。本申请通过上述方法实现了更精准地预测负载变化,减少人工干预和运维成本,更加智能化的资源调度的技术效果。
技术关键词
时序预测模型 负载预测方法 时间段 数据 计算机可执行指令 负载预测技术 初始化算法 线性插值法 计算机存储介质 告警规则 验证算法 编码 内存 处理器通信 存储器 训练集 注意力 平台
系统为您推荐了相关专利信息
1
一种基于声纹检测的地基夯实度评估方法及系统
度评估方法 声纹特征 噪声谱估计 频域去噪 关系型数据库
2
一种基于电梯内视频采集信息的广告自动推荐系统
推荐系统 电梯 视频 AdaBoost算法 食品店铺
3
解码电路、基带芯片、适用于redcap的HARQ方法及相关设备
解码电路 基带芯片 模块 传输块 基站
4
一种地质调查智能空间的数据资源治理方法
采集器 地质监测仪 语义特征提取 NoSQL数据库 资源
5
自动化控制代码生成与验证方法、装置、设备及存储介质
运动控制系统 自然语言 验证方法 知识图谱数据库 三维仿真模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号