摘要
本发明公开了一种X:M动态注意力稀疏方法及装置,本发明的方法包括对注意力分数矩阵进行预测,并基于预测结果进行X:M结构化剪枝以得到剪枝结果;基于剪枝结果更新缓存中的最小行号和索引行数并调整调度阈值,并将符合条件的索引块号存入优先级队列,以将对应的索引映射到PEA处理单元阵列进行执行。本发明极大地减小了注意力预测的存储和计算开销,同时将X:M与调度算法相结合,使得应用型专用集成电路中的处理单元在不同稀疏度下都能保持极高的利用率。
技术关键词
索引
注意力
稀疏方法
处理单元
ASIC芯片
矩阵
调度算法
检测器
先进先出队列
阵列
调度器
脉动方式
计数器
动态
集成电路
精度
重构
信号
格式
系统为您推荐了相关专利信息
船舶监测方法
信号特征
跨模态关联学习
特征提取模块
图像特征向量
历史轨迹数据
轨迹预测方法
多头注意力机制
车辆
交通控制信息
特征提取方法
YOLOv3算法
特征提取系统
形态学结构
多尺度形态学