摘要
本发明提供了一种基于CGRA实现计算加速的方法、装置和存储介质,涉及机器学习技术领域,包括:使用深度学习框架定义深度学习模型,生成计算图;将所述计算图转换为中间表示,生成中间表示文件;基于所述中间表示文件使用图划分算法进行操作符划分,并基于代价模型对所述操作符进行映射,生成数据流程图;基于所述数据流程图生成硬件配置文件,并通过FPGA工具对CGRA架构进行配置;将所述硬件配置文件加载到CGRA中并执行任务,同时进行监控;基于DMA机制收集硬件执行结果;基于RPC框架将所述硬件执行结果传回所述深度学习框架。能够根据深度学习网络的结构特点进行优化,提供定制化的加速效果。
技术关键词
深度学习框架
深度学习模型
划分算法
卷积神经网络模型
深度学习网络
机器学习技术
存储程序指令
可读存储介质
定义
存储器
计算机
数据
机制
处理器
系统为您推荐了相关专利信息
智能交互系统
触觉手套
力反馈模块
动态网格
分布式边缘
投资风险管理方法
企业
金融
大数据
训练卷积神经网络模型
变电站电气设备
灰度统计特征
ROI图像
符号
图纸
分块特征
调度特征
微服务架构
多源异构数据
加密数据