摘要
本公开提供了代码生成方法、装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及深度学习和计算机编译领域。具体实现方案为:确定深度学习模型的第一计算结构;其中,所述第一计算结构包括多层计算,所述多层计算包括循环计算和/或规约计算;基于硬件设备的体系结构参数,对所述第一计算结构进行调优,得到第二计算结构;其中,所述体系结构参数包括与线程和/或块相关的数量信息;基于所述第二计算结构,生成用于将所述深度学习模型部署于所述硬件设备上的代码。本公开可以提升模型计算的并行度,以及减少内存访问时间,从而提升计算资源的利用率以及代码执行效率,有利于加速模型在硬件设备上的训练和推理流程。
技术关键词
深度学习模型
硬件设备
代码生成方法
参数
代码执行效率
代码生成装置
模式
电子设备
模块
人工智能技术
计算机程序产品
处理器通信
指令
可读存储介质
分层
存储器
内存
系统为您推荐了相关专利信息
深度学习算法
施工智能
无人机巡检
工作机器
推荐方法
机器学习模型
氢气喷射器
燃料轨
氢喷射器
压力调节器