摘要
本发明公开了一种卷积神经网络模型轻量化方法和相关装置,将非恒等映射分支的每个BN层合并到前面最接近的卷积层,将1×1卷积层转换为3×3卷积层,将非恒等映射分支的非对称卷积层转换为3×3卷积层,然后去除恒等映射分支,对每个非恒等映射分支的卷积核数量和通道数量进行修改,并将每个非恒等映射分支的ReLU激活层替换为PReLU激活层,最后将每个非恒等映射分支对应位置的卷积层相加,得到单分支结构的卷积块。解决了现有的现有的卷积神经网络模型结构重参数化方法要求卷积层必须是常规的对称卷积,且当存在恒等映射分支时,其它分支中不能包含激活函数,限制了卷积神经网络的性能上限,应用范围受到了制约的技术问题。
技术关键词
卷积神经网络模型
分支
轻量化方法
通道
矩阵
存储程序代码
轻量化设备
参数化方法
可读存储介质
合并单元
补丁
积层
转换单元
处理器
存储器
计算机
元素
指令
系统为您推荐了相关专利信息
分支单元
交通预测方法
交通网络建模
机器学习模型
输出模块
复合材料层压板
层压复合材料
成型方法
剪切模量
纤维