一种混合粒度稀疏神经网络训练加速器及计算加速方法

AITNT
正文
推荐专利
一种混合粒度稀疏神经网络训练加速器及计算加速方法
申请号:CN202410729121
申请日期:2024-06-06
公开号:CN118569329A
公开日期:2024-08-30
类型:发明专利
摘要
本发明公开了一种混合粒度稀疏神经网络训练加速器及计算加速方法,包括输入缓存、权重缓存、输出缓存、行位图缓存、元素位图缓存以及稀疏计算模块;所述稀疏计算模块进一步包括一个行稀疏跳过单元和若干个稀疏卷积单元以及一个累加器;采用行、元素两级位图表示神经网络训练的不同阶段中卷积计算的输入、权重和输出的行、元素粒度的稀疏性;针对输出行位图非零标志,对输入和权重的行位图进行滑动匹配,发现并剔除包含全零行的无效一维卷积计算,实现粗粒度稀疏的利用;在执行有效一维卷积计算的过程中发现并剔除包含零值的无效乘累加计算,实现细粒度稀疏的利用。与现有技术相比,本发明能够提高神经网络训练效率,降低训练时长与能量消耗。
技术关键词
稀疏神经网络 加速器 元素 计算机可读指令 检测器 神经网络训练 索引 译码器 移位器 匹配器 乘累加器 加速计算方法 标志位 数据 格式 控制器 输入端 阶段 处理器
系统为您推荐了相关专利信息
1
基于早退神经网络的卫星智算任务处理系统
异构设备 复杂度 任务调度器 动态电压频率调节 功率
2
基于FPGA加速的高精度实时Stewart平台正向运动学求解方法
正向运动学 雅可比矩阵 CORDIC算法 神经网络量化 平台
3
一种鼻咽癌放疗计划生成方法、装置及设备
鼻咽癌放疗 计划生成方法 放疗计划 人工智能生成方法 剂量体积直方图
4
文件传输方法及计算设备
页面 文件传输方法 文件传输系统 虚拟键盘 目录
5
一种无线电缆构建方法、装置、电子设备及存储介质
无线电缆 校准 构建预编码矩阵 上存储计算机程序 电子设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号