摘要
本发明提出了一种基于齐次变换的低计算量神经网络仿射层优化方法,适用于移动设备和嵌入式系统。传统的仿射变换层需要分别计算线性变换和偏移量,导致计算步骤冗余,并增加了推理过程中的计算负担。本发明通过引入齐次坐标,将输入向量扩展为齐次坐标形式,使仿射变换的偏移量与权重矩阵统一表示为齐次变换矩阵,从而将仿射变换简化为一次矩阵乘法计算。该方法不仅能够减少独立的加法运算,提高计算效率,还能利用现有硬件加速器(如GPU、NPU)的矩阵运算加速特性,进一步提升推理速度。在移动设备和嵌入式系统中,该优化方法能够显著降低计算量、减少功耗,并提升实时应用性能,适用于图像分类、3D点云处理、AR/VR应用等多种任务场景。实验结果显示,本发明的方法在推理速度和功耗方面均优于传统仿射层计算方式,具有较大的应用前景和市场转化潜力。
技术关键词
嵌入式系统
神经网络模型
移动设备
硬件加速器
矩阵
3D点云
模型优化方法
神经网络推理
物体检测
坐标
功耗
自然语言
速度
负担
鲁棒性
图像
冗余
蒸馏
语音
场景