一种用于Vision Transformer神经网络的量化方法

AITNT
正文
推荐专利
一种用于Vision Transformer神经网络的量化方法
申请号:CN202411916173
申请日期:2024-12-24
公开号:CN119830971B
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开了一种用于Vision Transformer神经网络的高效量化方法,其包括S1、采用图像分类数据集对Vision Transformer神经网络进行训练,得到全精度模型;S2、在图像分类数据集的训练集中随机选取预设数量的图片输入全精度模型,统计模型每一层的权重和激活值的最大值和最小值,作为量化范围;S3、根据每层权重和激活值的量化范围,分别对对应层的权重和激活值进行非对称量化;S4、对Softmax后的激活值进行基于海森矩阵的双粒度量化,对层归一化层激活值进行基于通道优化的尺度重参数化量化,得到量化后的神经网络模型。
技术关键词
矩阵 神经网络模型 数值 图像 表达式 参数 数据 因子 精度 通道 图片 误差 元素
系统为您推荐了相关专利信息
1
基于多模态特征联合的变压器局部放电检测方法及系统
变压器局部放电检测方法 脉冲电流波形 声波 TDOA算法 多模态特征融合
2
一种放射治疗计划的多目标优化方法
放射治疗计划 网络 强度 监督学习方法 更新模型参数
3
数据处理方法、装置、计算机设备及存储介质
队列 数据处理方法 图像 移动装置 运动
4
太赫兹光谱信息探测方法和装置
图案 机器学习算法 宽带太赫兹光源 图像传感器 空间光调制器
5
一种基于融合模型的工程问题求解方法及系统
样本 焊接工艺参数 物理特征提取 焊接电流值 焊点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号