摘要
本申请公开了一种基于量化模型的推理方法,量化模型是基于经训练模型获得,量化模型的至少部分参数的精度小于经训练模型的参数精度,方法包括:获得输入任务数据;将输入任务数据输入至量化模型中,得到输出结果;量化模型包括多层神经元子模型,对于相邻层的第一子模型和第二子模型,第一子模型的输出激活值作为第二子模型的输入;在量化模型的特定相邻层的第二子模型包括融合权重矩阵参数的情况下,控制特定旋转矩阵作用于第一子模型的输出激活值获得经修改的激活值,经修改的激活值小于所述输出激活值,融合权重矩阵参数是特定旋转矩阵作用于与经训练模型对应的特定相邻层的第二子模型的第二初始权重参数获得的。
技术关键词
矩阵
推理方法
参数
数据
音视频
标识
精度
文本
语音
图像
符号
元素
系统为您推荐了相关专利信息
识别监测系统
数据处理模块
静态特征提取
混合网络
多模态