基于分段式神经元的模型压缩方法及装置、电子设备

AITNT
正文
推荐专利
基于分段式神经元的模型压缩方法及装置、电子设备
申请号:CN202510754362
申请日期:2025-06-06
公开号:CN120851108A
公开日期:2025-10-28
类型:发明专利
摘要
本申请涉及计算机技术领域,公开一种基于分段式神经元的模型压缩方法及装置、电子设备,其中,模型压缩方法包括:对目标模型的各个层进行分析,获得模型分析结果;根据模型分析结果,对目标模型各个层的神经元数据进行分段,获得多个神经元数据段;根据不同神经元数据段对模型性能的影响,生成每个神经元数据段对应的目标缓存管理策略;根据目标设备的硬件特性和目标缓存管理策略,将多个神经元数据段分别缓存至目标设备,实现目标模型在目标设备上的压缩。根据不同神经元数据段对模型性能的影响所生成的目标缓存管理策略,可以优先保证对模型性能影响较大的神经元数据段的缓存和访问效率,从而确保模型在压缩后仍能保持较高的性能和准确性。
技术关键词
缓存管理策略 模型压缩方法 分段 电子设备本体 数据访问模式 指标 缓存命中率 复杂度 测试方法 分析模块 处理器 参数 程序 指令 内存
系统为您推荐了相关专利信息
1
应用于城市地下管网的地下管线故障定位方法和装置
城市地下管网模型 管线组 故障缓冲区 地下管线施工 分段
2
一种企业生产数据微服务粒度优化方法、介质及系统
混合优化算法 系统响应时间 方程 灰狼算法 遗传算法
3
基于蚁狮优化的无人机集群动态任务分配方法
动态任务分配方法 无人机集群 蚁狮优化 蚂蚁 矩阵
4
面向已有工程结构模型的直接拓扑和形状优化方法
仿真模型 形状优化方法 六面体 多部件 典型
5
一种基于安全域的飞机金属增材件力控高效数控加工方法
切削力 刀具 分段 轮廓模型 飞机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号