一种基于内存算力感知的模型剪枝方法、设备及介质

正文

推荐专利

申请号：CN202410874867

申请日期：2024-07-02

公开号：CN118409872B

公开日期：2024-09-27

类型：发明专利

摘要

本发明涉及人工智能技术领域，具体公开了一种基于内存算力感知的模型剪枝方法、设备及介质，通过在确定包括目标设备的硬件资源参数和多个人工智能模型推理任务的硬件配置参数及模型精度需求参数后，以在目标设备部署的人工智能模型推理任务所需的硬件资源不超出目标设备的硬件资源参数为第一约束条件，以各人工智能模型推理任务的模型精度满足对应的模型精度需求参数为第二约束条件，对需部署在目标设备的人工智能模型推理任务所采用的人工智能模型进行多模型的模型剪枝处理，实现了基于设备硬件资源的多任务模型剪枝处理，进而实现在保证任务需求的条件下将多人工智能任务的部署在有限的硬件资源上，节省设备的算力资源和内存资源。

技术关键词

人工智能模型模型剪枝方法内存多模型精度参数非易失性存储介质存储计算机程序人工智能技术计算机程序产品处理器资源指令存储器基准

系统为您推荐了相关专利信息

一种基于影响力剪枝采样的联邦数据估值方法

客户端估值方法服务器近似误差模型训练方法

一种汽车用户需求信息处理方法、计算机装置和存储介质

需求信息处理方法汽车动作特征人工智能模型计算机装置

一种基于演化函数的目标集一致性的机器人控制方法

机器人控制方法机器人控制器机器人自动控制技术动力系统机器学习样本

电网压差调节方法、装置、电子设备及存储介质

支撑系统压差调节方法粒子群算法电压系统特征

一种多模态组织分割方法及手术导航系统

组织分割方法模态医学影像三维医学影像手术导航系统深度学习网络模型

一种基于内存算力感知的模型剪枝方法、设备及介质

站点导航

APP 下载