摘要
本发明公开了一种异构计算集群的模型剪枝方法、设备及存储介质,涉及人工智能技术领域,包括:获取待剪枝神经网络模型;测试异构计算集群中各异构算力执行待剪枝神经网络模型中各神经层分别对应的执行耗时;根据各执行耗时计算各异构算力分别对应的总耗时;获取运行待剪枝神经网络模型的内存大小要求;将满足内存大小要求且总耗时最小的异构算力确定为目标异构算力;利用目标异构算力按照剪枝后神经网络模型需满足的预设精度要求和预设耗时要求,对待剪枝神经网络模型进行剪枝。本发明能够为待剪枝神经网络模型选择合适的异构算力,提高了压缩后的模型执行效率和精度。
技术关键词
模型剪枝方法
神经网络模型
异构
集群
精度
序列
可读存储介质
存储计算机程序
人工智能技术
软件更新
计算机程序产品
列表
处理器
参数
存储器
系统为您推荐了相关专利信息
连续型
数据分析方法
归一化方法
变量
高斯混合模型
仿真培训系统
无人机飞控模块
数据管理模块
通信链路
高精度数字高程模型
卷积神经网络模型
图像修复模型
手工特征
图像修复方法
真实图像数据
配电网无功补偿
补偿机构
功率因数
历史数据特征
实时数据
量子比特操控
信噪比数据
量子芯片
高斯概率模型
驱动信号