摘要
本发明涉及人工智能技术领域,公开了一种基于“弹性伸缩”机制的AI算力平台,包括:任务队列模块维护由多个用户端提交的用户任务组成的动态任务列表;历史运行日志数据库收集用户任务多维度资源的历史任务日志数据;任务资源预测模块根据历史运行日志数据预测多维度资源需求;AI算力调度模块根据任务资源预测结果,采用预设的AI算力资源伸缩调度算法,将任务部署到可以满足资源需求的服务器节点中;状态同步反馈模块更新任务执行状态和集群资源状态,并反馈状态变化。本发明解决资源利用率与任务性能的平衡难题,提升大规模集群环境下AI任务调度的智能化与高效性,满足实时性、高并发任务的资源管理需求,为AI应用提供更优的资源调度解决方案。
技术关键词
需求预测模型
服务器节点
队列
模块
资源监控
集群日志
调度算法
XGBoost模型
机制
数据
平台
动态资源调度
资源分配
特征值
机器学习方法
决策树模型
资源特征
系统为您推荐了相关专利信息
高精度关联方法
插件机
相机标定
多相机协同
坐标系
分布式调度系统
低压配电
历史负荷数据
分布式电源出力
支路
配电设备
历史运行数据
设备运行参数
特征筛选方法
三维模型
智能网联环境
信息检测模块
车辆控制模块
控制系统
加速度