摘要
本申请涉及计算机技术领域,公开一种基于分段式神经元的模型压缩方法及装置、电子设备,其中,模型压缩方法包括:对目标模型的各个层进行分析,获得模型分析结果;根据模型分析结果,对目标模型各个层的神经元数据进行分段,获得多个神经元数据段;根据不同神经元数据段对模型性能的影响,生成每个神经元数据段对应的目标缓存管理策略;根据目标设备的硬件特性和目标缓存管理策略,将多个神经元数据段分别缓存至目标设备,实现目标模型在目标设备上的压缩。根据不同神经元数据段对模型性能的影响所生成的目标缓存管理策略,可以优先保证对模型性能影响较大的神经元数据段的缓存和访问效率,从而确保模型在压缩后仍能保持较高的性能和准确性。
技术关键词
缓存管理策略
模型压缩方法
分段
电子设备本体
数据访问模式
指标
缓存命中率
复杂度
测试方法
分析模块
处理器
参数
程序
指令
内存
系统为您推荐了相关专利信息
城市地下管网模型
管线组
故障缓冲区
地下管线施工
分段
混合优化算法
系统响应时间
方程
灰狼算法
遗传算法
动态任务分配方法
无人机集群
蚁狮优化
蚂蚁
矩阵