一种适用于AI芯片的自动混合比特量化装置及方法

AITNT
正文
推荐专利
一种适用于AI芯片的自动混合比特量化装置及方法
申请号:CN202410954938
申请日期:2024-07-16
公开号:CN118917366A
公开日期:2024-11-08
类型:发明专利
摘要
本发明公开了一种适用于AI芯片的自动混合比特量化装置及方法,所述方法包括:将深度学习浮点模型转换为onnx模型并进行图优化;将图优化后的onnx进行INT8量化,并输出量化后的onnx模型;根据量化系数,将onnx模型拆分为不同子图,相同量化系数的节点划分为同一子图;对每个算子,将其输入和该输入对应的上一层输出转换为高比特输入和输出,再对当前算子所在子图进行推理,对比修改前和修改后的差异值;对所有算子前后的差异值进行排序,同时根据预先设定的高比特算子个数K,选出精度提升最优的K个算子配置为高比特类型,并生成混合比特配置表;根据所选配置生成混合比特模型;其效果是:本发明能兼顾模型精度与性能。
技术关键词
芯片 处理器 精度 节点 参数 模块 误差
系统为您推荐了相关专利信息
1
通用算力的管理方法、装置、设备、介质及程序产品
事件流 资源 管理方法 节点 钩子
2
一种显影盒
显影盒 成像装置 芯片支架 显影辊 输入齿轮
3
加速训练神经网络模型方法、装置、设备及存储介质
训练神经网络模型 规划 参数更新模块 策略 地图
4
基于协同智能的无人机群动态路径规划方法及系统
动态路径规划方法 节点 无人机集群 动态路径规划系统 标识
5
一种基于无线信号的隧道变形监测系统及方法
信号监测单元 隧道变形监测系统 隧道变形监测方法 信号传播时延 射频收发模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号