摘要
本申请提供一种基于动态异构资源感知的AI芯片自适应部署方法及系统,属于人工智能芯片部署技术领域,所述方法:在集群内的AI芯片节点部署资源监控进程,实时采集AI芯片节点的异构指标数据,并按照采样间隔上传至调度控制器;调度控制器响应接收到任务请求,解析任务请求参数,根据实时性标记选择调度算法:使用LSTM模型预测任务请求所需算力资源,在目标AI芯片节点上进行预留,并将预留的算力资源映射为Kubernetes可调度资源;调度控制器根据任务执行情况及目标AI芯片节点的异构指标数据对任务进行动态调整与优化。本发明实现对异构计算环境中AI芯片资源的调度与管理,提升资源利用率,降低任务执行延迟。
技术关键词
调度控制器
遗传算法
LSTM模型
资源监控
跨节点
动态
贪心算法
调度算法
最大化资源利用率
参数
集群资源利用率
异构计算环境
指标
人工智能芯片
进程
系统为您推荐了相关专利信息
数据混合驱动
柔性控制方法
温控
长短期记忆网络
负荷
风险预测方法
人工智能模型
参数
空间分布特征
数据
结构设计优化方法
板对板连接器
插拔力
信号端子
端子主体
天线设计方法
遗传算法优化
电磁仿真
矩阵
像素结构
聚醚多元醇
列管反应器
柠檬酸
双流雾化喷头
序列