推理引擎创建方法、产品、设备及计算机可读存储介质

正文

推荐专利

申请号：CN202410924977

申请日期：2024-07-11

公开号：CN118469024B

公开日期：2024-10-15

类型：发明专利

摘要

本发明公开了一种推理引擎创建方法、产品、设备及计算机可读存储介质，涉及推理领域，为解决推理引擎不便于在设备上部署的问题，该方法包括获取初始模型的各个网络层的权重；确定每一网络层的权重变化为目标权重后对模型损失的影响参数，基于每一影响参数确定每一网络层的权重为主要权重或次要权重；按量化精度需求对主要权重进行第一量化操作得到第一权重，并获取第一量化操作对应的第一补偿参数；对主要权重对应的网络层进行算子融合操作，得到与初始模型对应的推理引擎。本发明能够在实现对模型最大程度的压缩的同时，最大程度维持初始模型的原有精度，减小对计算设备的存储空间的占用，便于在计算设备上部署，提高了推理引擎的推理准确性。

技术关键词

注意力参数可读存储介质多层感知机精度线性存储块存储计算机程序数据计算机程序产品算法处理器序列矩阵电子设备指令内存存储器物理

系统为您推荐了相关专利信息

基于IG算法求解分布式流水车间调度问题的方法

工件启发式方法重置方法重构置换流水车间调度

酿酒葡萄枝条修剪重量预测方法和系统、存储介质

葡萄变量人工神经网络模型机器学习模型统计学方法

一种高精度抗干扰导航之干扰子空间快速求解方法

多级维纳滤波阵列天线相位中心子空间快速求解方法协方差矩阵高精度抗干扰

一种红树林生态修复恢复效果的评估预测方法

评估预测方法红树林生态模拟模型特征值

基于无人机LiDAR技术的森林林火蔓延模拟方法及系统

无人机LiDAR技术林火蔓延模拟方法区域特征提取强化学习框架深度强化学习模型

推理引擎创建方法、产品、设备及计算机可读存储介质

站点导航

APP 下载