摘要
本发明公开了一种面向点云检测的神经网络压缩方法及加速器,所述方法在网络模型中插入阈值预测子网络生成双阈值,网络训练时根据激活值与阈值关系进行剪枝、子流形稀疏卷积或标准卷积,网络推理时应用训练所得阈值。本发明的加速器基于FPGA对点云进行检测,该加速器的核心单元为计算单元,由1152个PE单元构成并行计算阵列,同时支持子流形稀疏卷积和标准卷积,使神经网络在加速器上推理时可以以上述压缩方法实时压缩,提高推理效率,实现了硬件友好型低延迟高能效的加速器。本发明的压缩方法减小了剪枝对检测精度的影响,解决了剪枝后精度下降过多的问题,并提供了压缩方法在硬件上高效实现的方案。
技术关键词
神经网络压缩方法
加速器
点云
总线接口单元
并行计算单元
特征值
参数
检测网络模型
指令
检测损失
数据
多层感知机
控制单元
处理器
阵列
高能效
分块
可读存储介质
精度
系统为您推荐了相关专利信息
虚拟环境系统
CAVE系统
RGBD相机
LED屏幕
三维点云数据
运动状态参数
编码特征
生成投影图像
重建点云
人形机器人
路面识别方法
激光雷达
路面特征
车辆油气悬架
主动控制方法
车载屏幕
完整点云数据
深度相机
关键点
法向量夹角
三维点云数据
岩体结构面
均值算法
图形处理技术
三维点云模型