摘要
本发明提出了基于浮点指令集扩展的通用Transformer加速方法及系统,包括:构建乘法器,乘法器包括依次连接的多级加法器,4‑Booth编码算法对数据进行编码;编码后的数据依次经过多级加法器进行运算,获得乘法器的输出;构建浮点数寄存器,具体步骤为:添加浮点数寄存器组,产生浮点数寄存器组,浮点数寄存器组的写端口逻辑将输入的结果寄存器索引和各自的寄存器号码相对应,产生写使能信号,使能的通用寄存器将数据写入到寄存器当中,读端口使用一个多路并行选择器来实现,多路并行选择器的选择信号为读操作数寄存器的索引;RISC‑V处理器基于构建的乘法器及浮点数寄存器对Transformer神经网络的运行进行加速。
技术关键词
浮点数
乘法器
指令
多路并行
加法器
执行浮点运算
索引
译码环节
编码算法
访问存储器
信号
模块
数据
信息更新
端口
加速系统
号码
参数
系统为您推荐了相关专利信息
指令响应方法
大语言模型
上下文感知方法
特征权重学习
视角
元素
审核方法
图像分类模型
计算机可读指令
标签
误差麦克风
ARMA模型
传递函数估计方法
递归最小二乘法
FxLMS算法
故障检测模型
智能监控方法
异常状态
计算机可读指令
平台