一种内核代码的循环展开方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411496155

申请日期：2024-10-25

公开号：CN119002931B

公开日期：2024-12-27

类型：发明专利

摘要

本发明公开了一种内核代码的循环展开方法、装置、设备及存储介质，涉及深度学习技术领域，包括：在神经网络模型推理过程中，分别捕获神经网络模型各层输出张量的大小；根据各层输出张量的大小确定各层分别对应的当前展开因子；根据各当前展开因子生成当前统一计算设备架构代码，并对当前统一计算设备架构代码进行编译，得到编译后统一计算设备架构代码；利用编译后统一计算设备架构代码对内核代码进行循环展开，并获取当前循环展开时间；根据当前循环展开时间对各当前展开因子进行调整，得到各层分别对应的目标展开因子；根据各目标展开因子对内核代码进行循环展开。本发明降低了开发难度和成本，提高了展开因子与硬件架构的兼容性。

技术关键词

设备架构因子神经网络模型内核动态链接库应用程序编程接口深度学习技术可读存储介质图形处理器存储计算机程序计算机程序产品策略钩子模块存储器

系统为您推荐了相关专利信息

一种基于集成式的热电企业安全管理系统及方法

热电企业预测误差电网负荷调度耦合算法管理系统

一种基于电动尾门的速度控制方法、装置、设备以及介质

撑杆电机扩张状态观测器速度控制方法预测系统参数

基于深度学习的洪水场次划分方法及装置

洪水预测模型序列划分方法长短期记忆网络因子

一种穿越机无线电信号干扰方法

模式识别模型编码误差函数超参数无线电信号干扰

一种基于CNN-LSTM模型的渔场产量概率分布预测方法及装置

海洋环境因子捕捞努力量概率分布预测方法局部空间特征长短期记忆网络

一种内核代码的循环展开方法、装置、设备及存储介质

站点导航

APP 下载