摘要
本发明实施例公开了一种适用于AI芯片的量化调优装置及方法,所述方法包括:按约束条件将模型拆分成多个子图;其中,所述模型为深度学习浮点模型,所述约束条件为AI芯片在量化过程中所面临的限制;采用组合方式,组合了众多调优设定,以得到对应的调优策略;依次对每个子图结合所述调优策略进行调优处理并进行效果判断;若判断结果为优于调优前且已为最后一个子图时,结束量化调优并更新对应的量化参数;其效果是:本发明能够在保持模型精度的前提下,实现更好的模型压缩和加速效果。
技术关键词
调优方法
芯片
策略
参数
模型压缩
指标
模块
定义
校准
精度
系统为您推荐了相关专利信息
电厂热控
热控仪表
设备控制单元
远程监控单元
记忆模型
内存模组
断电保护功能
测试接口
最小化误差
压力测试方法
能效
风机运行参数
深度学习模型
设备状态参数
数据
自然语言
云平台运维方法
生成执行计划
意图识别
执行器