摘要
本发明公开了一种AI加速引擎装置和设备,该装置包括:引擎控制模块,用于接收指令分发部件发送的AI指令,对AI指令进行解析;若AI指令为对第一操作数的第一加载指令,则从本地存储部件中加载第一操作数,并将加载的第一操作数送入点积阵列;若AI指令为对第二操作数的第二加载指令,则从本地存储部件中加载第二操作数,并将加载的第二操作数送入点积阵列;若AI指令为写回指令,则将后处理模块中的计算结果写回本地存储部件;点积阵列,用于对第一操作数和第二操作数执行点积运算,并将计算结果送入后处理模块;后处理模块,用于对点积阵列的计算结果执行后处理操作。本方案可以优化AI加速计算方案,结合AI计算与HPC计算的优点。
技术关键词
指令
引擎控制模块
后处理模块
执行点积运算
引擎装置
数据格式
阵列
转换单元
索引
分发模块
缓冲
数据处理单元
卷积算法
IO模块
处理器
先进先出
电子设备
系统为您推荐了相关专利信息
底模模块
造桥机
走行模块
内模
Dijkstra算法
物流管理系统
物流信息平台
订单
分析单元
预警模块
轨道交通数据
数据采集接口
轨道交通信息
发布系统
指令