摘要
本发明涉及人工智能技术领域,具体公开了一种基于内存算力感知的模型剪枝方法、设备及介质,通过在确定包括目标设备的硬件资源参数和多个人工智能模型推理任务的硬件配置参数及模型精度需求参数后,以在目标设备部署的人工智能模型推理任务所需的硬件资源不超出目标设备的硬件资源参数为第一约束条件,以各人工智能模型推理任务的模型精度满足对应的模型精度需求参数为第二约束条件,对需部署在目标设备的人工智能模型推理任务所采用的人工智能模型进行多模型的模型剪枝处理,实现了基于设备硬件资源的多任务模型剪枝处理,进而实现在保证任务需求的条件下将多人工智能任务的部署在有限的硬件资源上,节省设备的算力资源和内存资源。
技术关键词
人工智能模型
模型剪枝方法
内存
多模型
精度
参数
非易失性存储介质
存储计算机程序
人工智能技术
计算机程序产品
处理器
资源
指令
存储器
基准
系统为您推荐了相关专利信息
需求信息处理方法
汽车
动作特征
人工智能模型
计算机装置
机器人控制方法
机器人控制器
机器人自动控制技术
动力系统
机器学习样本
支撑系统
压差调节方法
粒子群算法
电压
系统特征
组织分割方法
模态医学影像
三维医学影像
手术导航系统
深度学习网络模型