摘要
本发明请求保护一种卷积神经网络加速器指令集架构及Faster R‑CNN算法部署方法,主要涉及一种边缘侧卷积神经网络加速器的自定义指令集架构和部署Faster R‑CNN的方法。该卷积神经网络加速器的自定义指令集架构及Faster R‑CNN算法部署方法包括指令访问接口、卷积神经网络加速器指令集、Faster R‑CNN算法预部署处理、Faster R‑CNN算法部署方法,指令支持的并行模型选择方法,创新点在于该卷积神经网络加速器采用自定义指令集架构进行设计,其不仅兼容卷积神经网络内常见的运算层,还可以适配二阶段目标检测神经网络算法内其它数据处理运算。除此之外,创新点还在于给出了Faster R‑CNN算法从训练结束后到部署到硬件加速器上的全部流程及实施方法。本发明可以利用该指令集和该部署方法将Faster R‑CNN算法完成部署在加速器上,舍弃了主处理器和协处理器混合运算算法的方式,对二阶段目标检测神经网络算法进行全面加速,同时减少了主处理器和协处理器协同工作的难度和访问延迟。
技术关键词
并行计算模式
指令流
协处理器
卷积神经网络参数
卷积神经网络结构
卷积神经网络算法
硬件加速电路
神经网络加速器
ASIC电路
加速器接口
数据流结构
阶段
硬件加速器
部署算法
系统为您推荐了相关专利信息
融合视觉特征
推理方法
图像
全局视觉特征
特征金字塔网络
注意力机制
三维点云数据
解码模块
机器人视觉导航
视觉传感器
火力发电机组
评分方法
操作台
强化学习框架
OPCUA协议