摘要
本申请提供一种推理资源优化方法、装置及电子设备,该方法包括:获取神经网络模型在不同硬件资源下的推理服务响应性能数据,以及在不同硬件资源下的硬件成本数据;对推理服务响应性能数据和硬件成本数据进行优化建模,获得硬件成本最小的硬件资源部署方案;根据硬件成本最小的硬件资源部署方案生成神经网络模型的配置文件;根据配置文件对神经网络模型和不同硬件资源进行自适应调度优化。在上述方案的实现过程中,通过对推理服务响应性能数据和硬件成本数据进行优化建模,并根据获得硬件成本最小的硬件资源部署方案生成的配置文件,对神经网络模型和不同硬件资源进行自适应调度优化,从而有效地提高了硬件资源的利用率。
技术关键词
整数线性规划
服务器内存
资源优化方法
加速器
生成神经网络模型
机器可读指令
参数
资源调度优化
推理服务器
令牌
电子设备
处理器
可读存储介质
数据获取模块
计算机程序产品
系统为您推荐了相关专利信息
分数阶比例积分控制器
回旋加速器
速度控制方法
RBF神经网络
射频
优化调度方法
梯级水电
静态无功补偿器
条件生成对抗网络
两阶段随机优化