摘要
本发明提出一种基于SIMT的神经网络处理器及其任务执行方法,包括:通用处理器查询协处理器的状态寄存器,状态寄存器存储协处理器的资源情况;通用处理器根据该资源情况,完成线程块到线程束的拆分,通用处理器将线程束指令转发给协处理器的线程束分配器;线程束分配器将线程束中的指令依次译码,并调度到不同计算核心的指令队列中,线程束按照顺序依次进行线程束调度、指令发射和指令执行,从而并行完成神经网络任务的所有计算,得到神经网络任务的运行结果。本发明在线程束调度器前引入一个用于任务拆分的通用处理器或直接使用特定的编译器,即可实现线程的动态调度,使得根据数据精度动态扩展线程数量的方案成为可行的架构选项。
技术关键词
神经网络处理器
协处理器
神经网络处理单元
全局调度器
指令
内存系统
分配器
信息显示设备
队列
发射单元
译码器
核心
高性能
人工智能模型
资源
数据
计算机程序产品
系统为您推荐了相关专利信息
自动验收方法
变电站
关键字
语义分割模型
电网潮流分布
天线装置
反射板
天线阵列
计算机执行指令
电磁仿真
资源
数据处理方法
计算机执行指令
算法
可读存储介质