模型量化方法、装置、相关设备及计算机程序产品

AITNT
正文
推荐专利
模型量化方法、装置、相关设备及计算机程序产品
申请号:CN202411459812
申请日期:2024-10-18
公开号:CN119312846A
公开日期:2025-01-14
类型:发明专利
摘要
本申请公开了一种模型量化方法、装置、相关设备及计算机程序产品,本申请考虑到模型内部不同层级对量化的敏感度可能不同,为了实现更优的量化策略,并非以整个目标模型作为量化粒度,而是以目标模型的每一层作为量化粒度,根据每一层的权重和激活的数值大小,确定每一层的量化目标,进而可以按照每一层的量化目标,分别对目标模型中的每一层进行量化处理。本申请对于目标模型的每一层均确定与之匹配的量化目标,使得每一层能够按照更加匹配的量化目标进行量化处理,相比于传统方案对整个模型采用同一量化目标进行处理,本申请方案的量化策略更加优异,能够更好的平衡量化后模型的参数量及计算精度,提升模型量化的效果。
技术关键词
计算机程序产品 超参数 数值 算法 处理器 解析单元 在线 离线 代表 可读存储介质 处理单元 存储器 策略 通道 样本 矩阵 电子设备 层级 元素
系统为您推荐了相关专利信息
1
一种基于AI大模型的文学数据可视化方法
数据可视化方法 节点 传播算法 标记 直线
2
一种基于人工智能的配电网数据采集优化方法、系统及介质
配电网调度优化 配电网数据采集 数据预测模型 数据采集模式 动态监控
3
隐藏式门把手的防误触方法、系统、存储介质和智能汽车
隐藏式门把手 数字模拟转换器 误触方法 电容传感器 正则化方法
4
一种探针卡水平校准方法及装置
水平校准方法 探针卡 三维位置信息 平面度 位点
5
一种基于大模型的空调系统全生命周期运维诊断方法
运维 诊断方法 特征值 构建决策树 皮尔逊相关系数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号