一种基于内存算力感知的模型剪枝方法、设备及介质

AITNT
正文
推荐专利
一种基于内存算力感知的模型剪枝方法、设备及介质
申请号:CN202410874867
申请日期:2024-07-02
公开号:CN118409872B
公开日期:2024-09-27
类型:发明专利
摘要
本发明涉及人工智能技术领域,具体公开了一种基于内存算力感知的模型剪枝方法、设备及介质,通过在确定包括目标设备的硬件资源参数和多个人工智能模型推理任务的硬件配置参数及模型精度需求参数后,以在目标设备部署的人工智能模型推理任务所需的硬件资源不超出目标设备的硬件资源参数为第一约束条件,以各人工智能模型推理任务的模型精度满足对应的模型精度需求参数为第二约束条件,对需部署在目标设备的人工智能模型推理任务所采用的人工智能模型进行多模型的模型剪枝处理,实现了基于设备硬件资源的多任务模型剪枝处理,进而实现在保证任务需求的条件下将多人工智能任务的部署在有限的硬件资源上,节省设备的算力资源和内存资源。
技术关键词
人工智能模型 模型剪枝方法 内存 多模型 精度 参数 非易失性存储介质 存储计算机程序 人工智能技术 计算机程序产品 处理器 资源 指令 存储器 基准
系统为您推荐了相关专利信息
1
一种基于影响力剪枝采样的联邦数据估值方法
客户端 估值方法 服务器 近似误差 模型训练方法
2
一种汽车用户需求信息处理方法、计算机装置和存储介质
需求信息处理方法 汽车 动作特征 人工智能模型 计算机装置
3
一种基于演化函数的目标集一致性的机器人控制方法
机器人控制方法 机器人控制器 机器人自动控制技术 动力系统 机器学习样本
4
电网压差调节方法、装置、电子设备及存储介质
支撑系统 压差调节方法 粒子群算法 电压 系统特征
5
一种多模态组织分割方法及手术导航系统
组织分割方法 模态医学影像 三维医学影像 手术导航系统 深度学习网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号