基于量化模型的推理方法和模型量化方法

AITNT
正文
推荐专利
基于量化模型的推理方法和模型量化方法
申请号:CN202510630169
申请日期:2025-05-15
公开号:CN120654746A
公开日期:2025-09-16
类型:发明专利
摘要
本申请公开了一种基于量化模型的推理方法,量化模型是基于经训练模型获得,量化模型的至少部分参数的精度小于经训练模型的参数精度,方法包括:获得输入任务数据;将输入任务数据输入至量化模型中,得到输出结果;量化模型包括多层神经元子模型,对于相邻层的第一子模型和第二子模型,第一子模型的输出激活值作为第二子模型的输入;在量化模型的特定相邻层的第二子模型包括融合权重矩阵参数的情况下,控制特定旋转矩阵作用于第一子模型的输出激活值获得经修改的激活值,经修改的激活值小于所述输出激活值,融合权重矩阵参数是特定旋转矩阵作用于与经训练模型对应的特定相邻层的第二子模型的第二初始权重参数获得的。
技术关键词
矩阵 推理方法 参数 数据 音视频 标识 精度 文本 语音 图像 符号 元素
系统为您推荐了相关专利信息
1
用于向用户推荐产品的方法、计算设备和存储介质
产品特征标签 深度Q网络 注意力 处理单元 关系
2
一种车间洁净度与空调风机转动频率协同优化控制方法
空调风机 粉尘 频率 协同优化控制方法 湍流
3
一种基于AI的平台用户行为识别监测系统
识别监测系统 数据处理模块 静态特征提取 混合网络 多模态
4
查询变换器的训练方法、多模态大模型预训练方法及电力系统变电站检修方法
变换器 图片 预训练方法 文本 大语言模型
5
基于社群发现的协同管理权限规则计算方法及系统
社群画像 数据分类 特征提取模块 协作对象 组织
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号