摘要
本申请公开了一种任务调度方法、装置、设备、存储介质及产品,涉及人工智能技术领域。本申请将大模型拆分为多个子任务,并实时对算力需求进行量化,结合各神经网络处理器节点的算力评估信息,计算可调度任务与各个神经网络处理器节点的匹配得分,将调度队列中优先级最高的可调度任务分配至匹配得分最高的神经网络处理器节点中,通过循环执行,从而对不同大模型的各子任务进行合理分配;另外,基于调度策略为调度队列中的多个待调度子任务分配优先级并通过贪心算法进行调度,能够保证每次的调度行为均为实时的最优调度方案,从而解决了如何更高效率地调度大模型任务,高效地利用神经网络处理器的算力资源以减少算力浪费的技术问题。
技术关键词
神经网络处理器
任务调度方法
队列
节点
任务调度设备
表达式
任务调度装置
内存
计算机程序产品
性能测试数据
生成拓扑图
人工智能技术
贪心算法
排序算法
高效率地
策略
匹配模块
系统为您推荐了相关专利信息
数字孪生
资源优化方法
数据同步
信号覆盖范围
对象
控制单元
指令调度方法
指令并行执行
存储设备
控制器
电网拓扑模型
重合闸策略
配电网络
保护系统
融合特征
蛋白质生物标志物
机器学习算法
XGBoost算法
XGBoost模型
多元线性回归模型