摘要
本申请提供一种资源分配方法、装置、设备及介质,该方法包括:获取候选算法的基本信息,所述基本信息用于指示每个所述候选算法在同一业务场景下的算力、内存及耗时需求,所述候选算法包括神经网络算法和/或普通算法;根据所述基本信息,获取所述候选算法对应的资源划分策略,所述资源划分策略用于指示每个候选算法对已有NPU资源的划分;当业务运行时,根据所述资源划分策略启动候选算法,以使每个候选算法按照预先分配的NPU资源运行。该方法可以通过离线方式确认候选算法的算力需求,并通过划分NPU的资源,将多个候选算法部署到NPU的不同资源上,实现了对神经网络算法和/或普通算法的并行加速,提高了NPU资源的利用率,同时降低了其他资源的负载。
技术关键词
神经网络算法
计算机执行指令
策略
资源分配方法
资源分配装置
内存
可读存储介质
处理器
场景
时间段
存储器
电子设备
模块
数据
离线
指标