一种神经网络运算的加速方法及装置

正文

推荐专利

一种神经网络运算的加速方法及装置

申请号：CN202510199254

申请日期：2025-02-21

公开号：CN120277309A

公开日期：2025-07-08

类型：发明专利

摘要

本发明实施例公开了一种神经网络运算的加速方法及装置；方法适用于基于decoder的大模型网络，包括：获取矩阵乘阵列的第一输出结果；所述第一输出结果包括多个矩阵乘结果；从多个所述矩阵乘结果中获取第二输出结果；其中，所述第二输出结果为所述矩阵乘结果每一行的最大值；将所述第一输出结果和第二输出结果进行softmax后续计算，输出目标计算结果。与现有技术相比，本发明通过在矩阵乘阵列的非线性计算单元中增加最大值计算单元，将原本在softmax计算中的最大值计算提前到矩阵乘计算阵列中的非线性计算单元中。相较于现有解决方案，减少了随后softmax计算中一次数据加载的开销，并且没有改变原始算法的精度。

技术关键词

加速装置矩阵阵列输入设备存储计算机程序非线性存储器网络处理器加速器指令算法精度数据

系统为您推荐了相关专利信息

一种矢量地图构建方法、装置、存储介质及电子设备

矢量地图融合特征矩阵图像增强多尺度

面向肾病的远程居家透析数据管理云平台及数据分析方法

数据管理云平台居家数据分析方法诊疗室指标

输电压接金具的缺陷识别方法以及装置

金具三维成像缺陷识别方法声学传感器阵列频域特征

基于粒子群算法的噪声与大型基建项目选址分析方法

序列麦克风阵列大型基建项目选址分析方法风噪声

一种力量测量方法及装置

协方差矩阵应变片传感器负载传感器温度补偿系数测量方法

一种神经网络运算的加速方法及装置

站点导航

APP 下载