摘要
本发明提出了一种面向Transformer的专用加速器系统,属于深度学习领域。本发明包括多个可重构计算核,多个可重构计算核互联形成片上网络;每一可重构计算核均包括存储器、计算单元以及重构控制器;存储器用于存储计算所需的参数、数据和指令;重构控制器用于对计算单元进行重构配置,从而使得计算单元在计算时具备特定的算子功能;计算单元被重构控制单元配置后实现特定功能的计算。本发明可实现Transformer多核并行计算,并通过多线程并行的方式高效利用算法中的数据并行特性,实现低延迟计算。
技术关键词
重构控制器
加速器
存储器
控制单元
低延迟
多线程
指令
数据
网络
参数
算法
阵列
矩形
系统为您推荐了相关专利信息
漏洞防御方法
资源标识符
客户端
访问可信执行环境
指针
GRU模型
趋势预测方法
数据
电池
门控循环单元
扫地机器人
路径优化方法
遗传算法优化
序列
非易失性存储介质