摘要
本发明公开了一种基础C库融合神经网络加速的方法及系统,属于计算机软件技术领域。本发明采用轻量级的C标准库作为基础C库,在基础C库中面向主流架构处理器增加通用的NN加速模块;基础C库提供公共基础模块,封装常用神经网络操作接口;NN加速模块提供神经网络加速接口;基于主流神经网络框架进行模型训练时,将训练完成的模型进量化和转换以获得深度学习模型;NN加速模块调用graph和runtime模块完成深度学习模型的计算图构建,调用core和runtime模块进行推理计算。本发明将机器学习运用到嵌入式系统中,提供高性能神经网络推理能力,针对关键的神经网络接口进行微架构优化,降低复杂网络内存开销。
技术关键词
融合神经网络
深度学习模型
神经网络框架
模块
基础
计算机软件技术
神经网络推理
图像处理功能
平台
编译方法
卷积算法
嵌入式系统
定义
网络接口
多线程
编程
内存
高性能
系统为您推荐了相关专利信息
智能泵组
粒子群优化算法
响应负载变化
智能阀门
数学模型