基于存算一体架构的神经网络模型压缩方法及系统

AITNT
正文
推荐专利
基于存算一体架构的神经网络模型压缩方法及系统
申请号:CN202510401861
申请日期:2025-04-01
公开号:CN120471117A
公开日期:2025-08-12
类型:发明专利
摘要
本发明提供一种基于存算一体架构的神经网络模型压缩方法及系统,其方法包括:对神经网络模型每个卷积层,确定该卷积层输出通道的重要性评分;根据重要性评分确定剪枝阈值,并执行剪枝操作,修剪重要性评分低于剪枝阈值的输出通道,基于被修剪的输出通道相应修剪下一卷积层的输入通道;基于每个被修剪的卷积层,得到修剪后的神经网络模型;修剪后的神经网络模型用于调整交叉阵列结构。本发明通过确定卷积层输出通道的重要性评分,并据此设定剪枝阈值,精准修剪不重要的输出通道,同时相应修剪下一卷积层的输入通道,避免盲目剪枝对神经网络模型性能的影响,有效减少模型的冗余参数,降低神经网络模型的复杂度,使神经网络模型更加紧凑高效。
技术关键词
神经网络模型 交叉阵列结构 奇异值分解技术 修剪神经网络 压缩系统 通道 神经网络修剪 因子 通信接口 加速器 处理器 可读存储介质 矩阵 存储器 计算机程序产品 模块 复杂度 电子设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号