一种基于RISC-V向量的深度神经网络量化加速方法

正文

推荐专利

申请号：CN202410831667

申请日期：2024-06-25

公开号：CN119903880A

公开日期：2025-04-29

类型：发明专利

摘要

本发明公开了一种基于RISC‑V向量的深度神经网络量化加速方法，该方法包括如下步骤：根据向量寄存器堆大小进行分块，使得其大小和张量分块长度一致；计算分块后的张量的量化尺度(Δ，Quantization Scale)与零点(z，Zero Point)保存到一个全局数据结构中；修改编译器让其能识别拓展的乘除指令并完成编译；在向量架构下进行并行计算加速量化和反量化运算。本发明的目的在于解决目前不同神经网络在RISC‑V架构下量化与反量化时，执行相关的除加操作(Divide‑Accumulate Operation，DIVADD)和乘加操作(Multiply‑Accumulate Operation，MAC)时并行度较低、指令开销较大、数据在内存与计算单元间频繁移动而导致的额外功耗等问题。

技术关键词

深度神经网络向量寄存器堆全局数据结构分块自定义指令风格内存标志索引功耗规划分层程序

系统为您推荐了相关专利信息

工业互联网故障增量学习方法、装置、设备及介质

网络故障信息增量学习方法工业互联网样本数据

一种高维整周模糊度快速确定方法、介质及设备

整周模糊度协方差矩阵方程卡尔曼滤波算法观测噪声

一种基于拆分学习的大模型云边端协作训练框架及方法

终端设备协作训练方法云服务器深度神经网络模型参数

图像处理方法、装置、非易失性存储介质和计算机设备

非易失性存储介质自定义指令非均匀噪声图像处理方法雪花噪声

反射信道矩阵预测模型训练方法和反射信道矩阵获取方法

信道预测模型训练方法分块超表面矩阵获取方法

一种基于RISC-V向量的深度神经网络量化加速方法

站点导航

APP 下载