摘要
本发明公开了一种基于DSP的混合位宽计算单元及量化方法,该混合位宽计算单元包括:预加模块,包括执行输入处理部分、位操作部分和累加部分;乘法和累加模块,包括乘法部分和累加部分。该量化方法用于将CNN的不同层量化成不同的位宽,包括:获取权重数据;将与所述权重数据对应的32位浮点数用K个基向量和二进制编码向量的内积表示。通过使用本发明,能充分利用LUT资源,支持1b到8b权重计算,计算效率随权重位宽的降低而增加。本发明可广泛应用于神经网络加速器领域。
技术关键词
浮点数
神经网络加速器
编码向量
模块
符号
数据
元素
资源