基于量化模型的推理方法和模型量化方法

正文

推荐专利

基于量化模型的推理方法和模型量化方法

申请号：CN202510630169

申请日期：2025-05-15

公开号：CN120654746A

公开日期：2025-09-16

类型：发明专利

摘要

本申请公开了一种基于量化模型的推理方法，量化模型是基于经训练模型获得，量化模型的至少部分参数的精度小于经训练模型的参数精度，方法包括：获得输入任务数据；将输入任务数据输入至量化模型中，得到输出结果；量化模型包括多层神经元子模型，对于相邻层的第一子模型和第二子模型，第一子模型的输出激活值作为第二子模型的输入；在量化模型的特定相邻层的第二子模型包括融合权重矩阵参数的情况下，控制特定旋转矩阵作用于第一子模型的输出激活值获得经修改的激活值，经修改的激活值小于所述输出激活值，融合权重矩阵参数是特定旋转矩阵作用于与经训练模型对应的特定相邻层的第二子模型的第二初始权重参数获得的。

技术关键词

矩阵推理方法参数数据音视频标识精度文本语音图像符号元素

系统为您推荐了相关专利信息

用于向用户推荐产品的方法、计算设备和存储介质

产品特征标签深度Q网络注意力处理单元关系

一种车间洁净度与空调风机转动频率协同优化控制方法

空调风机粉尘频率协同优化控制方法湍流

一种基于AI的平台用户行为识别监测系统

识别监测系统数据处理模块静态特征提取混合网络多模态

查询变换器的训练方法、多模态大模型预训练方法及电力系统变电站检修方法

变换器图片预训练方法文本大语言模型

基于社群发现的协同管理权限规则计算方法及系统

社群画像数据分类特征提取模块协作对象组织

基于量化模型的推理方法和模型量化方法

站点导航

APP 下载