摘要
一种基于FPGA的结构等效卷积的量化节点融合方法,涉及深度学习模型压缩与硬件加速技术领域,其主要步骤为在模型训练阶段,在融合支路插入等效卷积层,等效卷积参数初始化为单位矩阵且禁止其进行梯度更新后进行训练,在模型量化阶段,在网络输入层插入量化节点,网络输出层插入反量化节点,进行动态范围联合校准、进行量化参数计算与量化参数对齐、进行整数域特征融合,最后计算相应的量化后的权重并输出。本发明通过引入支路等效变换层与量化域参数绑定操作,能够有效避免在硬件上的二次量化过程需要的除法操作,同时保持较高的量化精度,提高模型的部署效率。
技术关键词
融合方法
节点
深度学习模型压缩
参数
校准
硬件加速技术
支路
图像分类模型
因子
网络结构
数据
观察器
输出特征
阶段
矩阵
动态
通道
策略
系统为您推荐了相关专利信息
建筑运维管理系统
制冷设备
映射关系表
数字孪生模型
员工
稳定性分析系统
三维点云数据
遗传模拟退火算法
非接触式
子系统
访问控制策略
授权方法
区块链共识机制
分布式账本
兼容数据格式