摘要
本发明属于人工智能平台开发与运维领域,具体涉及一种人工智能平台任务管理方法与系统。该方法具体包括:通过K8s创建人工智能平台的训练任务对应的Pod;创建的Pod中包含训练任务的资源需求;利用K8s根据训练任务的资源需求为Pod分配满足资源需求的节点以执行Pod对应的训练任务;在设定的资源消耗高峰时段,减小非关键训练任务对应的Pod的资源需求的上限值;在设定的资源消耗低谷时段,增大非关键训练任务对应的Pod的资源需求的上限值。由此即可在资源紧张的时段内确保关键任务优先执行,并在资源充足的时段内加速非关键训练任务的完成,从而从整体上对人工智能平台的训练任务的完成进度进行优化。
技术关键词
人工智能平台
管理方法
资源
执行可执行程序
内存
可执行程序指令
指标
参数
管理系统
处理器
节点
副本
对象
关系
系统为您推荐了相关专利信息
企业采购管理方法
趋势预测模型
知识图谱驱动
迁移学习模型
节点
动态优先级调度算法
参数
冲突检测机制
语法检查器
模块
存储控制器
存储装置
芯片
存储系统
混合调度策略