摘要
本发明涉及基于外积的计算稀疏卷积和稀疏注意力的统一硬件架构,通过将稀疏卷积和稀疏注意力层中的计算分解成基本的外积计算,并基于基本的外积计算设计了统一硬件结构实现稀疏卷积和稀疏注意力层,具有很高的硬件复用率。还设计了分层蝶形路由网络用于将外积计算中产生的乘法结果路由到累加缓存区,能够达到与crossbar相近的带宽但分层蝶形路由网络比crossbar消耗更少的面积,同时具有更好的可扩展性。还设计了一种紧凑的对齐编码算法对稀疏数据进行编码,从而使得在将数据加载到乘法器阵列时,乘法器的每个周期都能接近满载,从而提高了稀疏情况下乘法器的利用率。
技术关键词
蝶形网络
注意力
乘法器
稀疏矩阵乘法
坐标
阵列
编码算法
分层
模块
输出端
输入端
周期
条目
条带
元素
数据
系统为您推荐了相关专利信息
动态调度优化方法
柔性作业车间调度
嵌入特征
深度强化学习
异构
柔性压力传感器
语音识别系统
信号调理模块
柔性传感器
主控芯片
任务分配策略
时空融合特征
实时状态信息
深度Q网络
时空注意力机制
图像分割方法
融合特征
分支
注意力机制
处理单元