一种面向DL编译器的预量化模型部署方法

正文

推荐专利

一种面向DL编译器的预量化模型部署方法

申请号：CN202411082583

申请日期：2024-08-08

公开号：CN119129709A

公开日期：2024-12-13

类型：发明专利

摘要

本发明属于深度学习编译器领域，公开了一种面向DL编译器的预量化模型部署方法，包括步骤1：前端框架解析器解析前端预量化的深度学习模型，输出包含Q算子的图；步骤2：进行面向Target，即目标平台的图切分操作，该操作之后，图将被分割为两部分：加速器支持的算子将在加速器上运行，加速器不支持的算子将在CPU上运行；步骤3：DL编译器将针对两部分采用不同的调度和代码生成，并采用两级，即函数级和算子级加速器代码生成器来产生加速器硬件指令和驱动函数。本发明支持面向加速器的切图功能，既能够完成Q算子到普通算子的降级，又能够使加速器子函数的输入输出格式满足硬件要求。

技术关键词

加速器模型部署方法子模块代码生成器列表深度学习模型指令解析器标志模式匹配内存数据内核标记元素平台框架三角形

系统为您推荐了相关专利信息

一种基于智能语义分析的数据识别方法

智能语义分析数据识别模型数据识别方法语义图谱节点

信息交互方法、装置、设备及存储介质

对象交互账号信息交互方法页面虚拟对象

一种智能小车循迹避障送货系统

智能小车循迹送货系统智能避让动力驱动模块主控单元

一种麻醉深度评估方法、装置、电子设备及存储介质

麻醉深度评估生命体征数据多模态噪声样本脉搏血氧饱和度

一种BIM构件的对比方法及装置

BIM构件控制点表达式度量坐标系

一种面向DL编译器的预量化模型部署方法

站点导航

APP 下载