摘要
本发明公开了一种高并行度Softmax软硬件协同设计方法,通过引入基于分布的和估计方法与Log2量化来改进Softmax算法,实现更少的面积开销、更快的运行速度和更低的能耗。该方法包括:统计阶段:处理整个输入向量以生成直方分布图和输入序列的最大值;和估计阶段:使用固定长度的直方图计算Softmax所需的指数近似和;归一化阶段:通过逐元素执行简化后的指数、除法计算并输出经过Log2量化后的Softmax结果;硬件实现:对于输入序列长度大于硬件数据并行处理长度的情况,先多次运行统计单元以获取完整序列的最大值与分布信息,然后执行一次和估计单元,最后多次运行归一化单元完成对所有元素的归一化处理。
技术关键词
软硬件协同设计方法
Softmax函数
指数
数据并行处理
阶段
序列
直方图
元素
树形结构
估计方法
移位器
加法器
算法
数学
能耗
组织
动态
定义
速度
系统为您推荐了相关专利信息
随机森林模型
指标
归一化植被指数
数据获取模块
分层
数据
交通
深度学习算法技术
k‑means算法
阶段
条件风险价值
虚拟电厂调度方法
两阶段
利润
负荷
医学成像装置
大语言模型
数据处理装置
协议
地点