摘要
本发明提供神经网络的量化压缩与算力自适应优化方法及系统,涉及神经网络技术领域,包括通过计算权重分布熵值和激活值分布熵值,构建神经元重要性评估指标,结合量化误差数据生成层间误差传播评估矩阵确定位宽配置方案,并基于目标设备计算负载进行差异化资源分配,最终实现神经网络在保证性能的前提下的高效压缩与部署,有效降低计算资源消耗并提高推理速度。
技术关键词
量化误差
资源分配优先级
网络性能评估
矩阵
特征值
指标
计算机程序指令
数据
参数
神经网络技术
误差补偿值
信息熵
策略
动态
因子
处理器
通信效率
时序特征