一种硬件感知的动态模型压缩方法及系统

AITNT
正文
推荐专利
一种硬件感知的动态模型压缩方法及系统
申请号:CN202510710314
申请日期:2025-05-29
公开号:CN120579593A
公开日期:2025-09-02
类型:发明专利
摘要
本申请涉及人工智能技术领域,公开一种硬件感知的动态模型压缩方法及系统,包括:将目标设备的硬件参数进行分类编码,生成统一的硬件特征向量;将所述硬件特征向量和待压缩模型的性能指标输入至已训练好的强化学习智能体,输出混合粒度裁剪策略和混合精度分配模式;根据所述混合粒度裁剪策略调整所述待压缩模型的模型结构,删除冗余节点并重连计算图;根据所述混合精度分配模式对所述待压缩模型的模型参数进行量化处理。本申请通过硬件参数编码、裁剪策略生成和混合精度优化的闭环框架,实现模型压缩与硬件资源的协同,生成适合部署硬件的模型压缩方案。
技术关键词
模型压缩方法 动态 参数 节点 精度 策略 多头注意力机制 编码 决策树方法 线性 归一化模块 冗余 极值 数值 人工智能技术 数据 重构 内存
系统为您推荐了相关专利信息
1
曲轴和凸轮轴的激励信号识别方法、装置、介质及设备
信号识别模型 凸轮轴 信号识别方法 多尺度特征 通道注意力机制
2
一种人才与岗位匹配方法
岗位匹配方法 文本特征向量 节点特征 预训练语言模型 融合特征
3
基于深度学习的OCR错漏检测方法
条件随机场 非线性图像增强 梯度提升模型 序列 文本
4
一种基于冗余测控装置61850多server配置方法及系统
虚拟测控单元 测控装置 SCD文件 文件夹 通信服务
5
车联网环境下基于邻居协作算法的高效假名动态更新方法
假名 动态更新方法 协作算法 邻居 可信机构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号