摘要
本发明公开了一种用于神经网络加速器的高并行度存储架构,包括:卷积神经网络的第一层输入模块接收原始图片数据;输入数据模块负责处理原始数据,将其转换为适合神经网络处理的形式;输入数据模块提供的数据作为权重模块的输入,权重模块提取对任务有用的图片特征。本发明将输入数据模块划分为分区组、单元组和基本单元,权重模块的层级结构划分为权重模块分区组和权重模块基本单元;同时对卷积神经网络的第一层输入进行拆分。本发明能够将单个输入通道拆分为多个通道,从而提高首层的计算并行度,避免计算资源和存储资源的浪费。本发明采用多单元多分区的数据存储技术,能够快速访问不同通道和不同大小的输入图像数据。
技术关键词
神经网络加速器
数据模块
通道
输入模块
图片
数据存储技术
尺寸
多分区
多单元
层级
代表
滤波器
图像
单层
模式
参数
系统为您推荐了相关专利信息
人形机器人
偏航电机
横滚电机
筒体结构
俯仰电机
条件生成对抗网络
图像去雾方法
图像去雾模型
无雾图像
有雾图像
插值算法
仿真控制方法
仿真控制装置
数据
处理器