摘要
本申请涉及人工智能技术领域,公开一种硬件感知的动态模型压缩方法及系统,包括:将目标设备的硬件参数进行分类编码,生成统一的硬件特征向量;将所述硬件特征向量和待压缩模型的性能指标输入至已训练好的强化学习智能体,输出混合粒度裁剪策略和混合精度分配模式;根据所述混合粒度裁剪策略调整所述待压缩模型的模型结构,删除冗余节点并重连计算图;根据所述混合精度分配模式对所述待压缩模型的模型参数进行量化处理。本申请通过硬件参数编码、裁剪策略生成和混合精度优化的闭环框架,实现模型压缩与硬件资源的协同,生成适合部署硬件的模型压缩方案。
技术关键词
模型压缩方法
动态
参数
节点
精度
策略
多头注意力机制
编码
决策树方法
线性
归一化模块
冗余
极值
数值
人工智能技术
数据
重构
内存
系统为您推荐了相关专利信息
信号识别模型
凸轮轴
信号识别方法
多尺度特征
通道注意力机制
岗位匹配方法
文本特征向量
节点特征
预训练语言模型
融合特征
条件随机场
非线性图像增强
梯度提升模型
序列
文本
虚拟测控单元
测控装置
SCD文件
文件夹
通信服务