一种卷积神经网络加速器指令集架构及Faster R-CNN算法部署方法

AITNT
正文
推荐专利
一种卷积神经网络加速器指令集架构及Faster R-CNN算法部署方法
申请号:CN202510290376
申请日期:2025-03-12
公开号:CN120297341A
公开日期:2025-07-11
类型:发明专利
摘要
本发明请求保护一种卷积神经网络加速器指令集架构及Faster R‑CNN算法部署方法,主要涉及一种边缘侧卷积神经网络加速器的自定义指令集架构和部署Faster R‑CNN的方法。该卷积神经网络加速器的自定义指令集架构及Faster R‑CNN算法部署方法包括指令访问接口、卷积神经网络加速器指令集、Faster R‑CNN算法预部署处理、Faster R‑CNN算法部署方法,指令支持的并行模型选择方法,创新点在于该卷积神经网络加速器采用自定义指令集架构进行设计,其不仅兼容卷积神经网络内常见的运算层,还可以适配二阶段目标检测神经网络算法内其它数据处理运算。除此之外,创新点还在于给出了Faster R‑CNN算法从训练结束后到部署到硬件加速器上的全部流程及实施方法。本发明可以利用该指令集和该部署方法将Faster R‑CNN算法完成部署在加速器上,舍弃了主处理器和协处理器混合运算算法的方式,对二阶段目标检测神经网络算法进行全面加速,同时减少了主处理器和协处理器协同工作的难度和访问延迟。
技术关键词
并行计算模式 指令流 协处理器 卷积神经网络参数 卷积神经网络结构 卷积神经网络算法 硬件加速电路 神经网络加速器 ASIC电路 加速器接口 数据流结构 阶段 硬件加速器 部署算法
系统为您推荐了相关专利信息
1
基于双路视觉编码的多模态视觉理解模型、训练方法、推理方法及设备
融合视觉特征 推理方法 图像 全局视觉特征 特征金字塔网络
2
一种基于体素空间注意力机制的移动机器人视觉导航方法
注意力机制 三维点云数据 解码模块 机器人视觉导航 视觉传感器
3
协处理器及其控制方法、片上系统及其控制方法、存储介质和电子设备
协处理器 控制单元 片上系统 内存 指令
4
一种基于CAN ID的控制节点自动识别与映射方法
节点 映射方法 报文 指令流 信息编码
5
火力发电机组仿真操作台的自动化评分方法和系统
火力发电机组 评分方法 操作台 强化学习框架 OPCUA协议
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号