一种内核代码的循环展开方法、装置、设备及存储介质

AITNT
正文
推荐专利
一种内核代码的循环展开方法、装置、设备及存储介质
申请号:CN202411496155
申请日期:2024-10-25
公开号:CN119002931B
公开日期:2024-12-27
类型:发明专利
摘要
本发明公开了一种内核代码的循环展开方法、装置、设备及存储介质,涉及深度学习技术领域,包括:在神经网络模型推理过程中,分别捕获神经网络模型各层输出张量的大小;根据各层输出张量的大小确定各层分别对应的当前展开因子;根据各当前展开因子生成当前统一计算设备架构代码,并对当前统一计算设备架构代码进行编译,得到编译后统一计算设备架构代码;利用编译后统一计算设备架构代码对内核代码进行循环展开,并获取当前循环展开时间;根据当前循环展开时间对各当前展开因子进行调整,得到各层分别对应的目标展开因子;根据各目标展开因子对内核代码进行循环展开。本发明降低了开发难度和成本,提高了展开因子与硬件架构的兼容性。
技术关键词
设备架构 因子 神经网络模型 内核 动态链接库 应用程序编程接口 深度学习技术 可读存储介质 图形处理器 存储计算机程序 计算机程序产品 策略 钩子 模块 存储器
系统为您推荐了相关专利信息
1
一种基于集成式的热电企业安全管理系统及方法
热电企业 预测误差 电网负荷调度 耦合算法 管理系统
2
一种基于电动尾门的速度控制方法、装置、设备以及介质
撑杆电机 扩张状态观测器 速度控制方法 预测系统 参数
3
基于深度学习的洪水场次划分方法及装置
洪水预测模型 序列 划分方法 长短期记忆网络 因子
4
一种穿越机无线电信号干扰方法
模式识别模型 编码 误差函数 超参数 无线电信号干扰
5
一种基于CNN-LSTM模型的渔场产量概率分布预测方法及装置
海洋环境因子 捕捞努力量 概率分布预测方法 局部空间特征 长短期记忆网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号