面向AIOT板卡的推理模型无缝迁移与自适应优化方法

正文

推荐专利

申请号：CN202411885470

申请日期：2024-12-20

公开号：CN119987998A

公开日期：2025-05-13

类型：发明专利

摘要

本申请属于推理模型迁移与优化技术领域，涉及面向AIOT板卡的推理模型无缝迁移与自适应优化方法；使用硬件性能分析工具对AIOT设备的计算能力进行全面评估，得到硬件性能指标，对原始推理模型进行分层，并利用分析工具评估每层的性能数据，再基于硬件性能指标和模型性能数据优化模型的转换策略，确保模型在转换过程中能够考虑到硬件的限制和模型性能的需求；基于确定的转换策略对原始推理模型的转换，并将其部署到AIOT板卡上，从而达到了无缝迁移的目的；其次采用深度学习模型和实时负载监控，动态调整推理的精度、批量大小和执行路径，使得推理模型能够根据实际运行情况自适应地优化，进一步提高了模型在有限资源下的效率和性能。

技术关键词

内存输出特征板卡深度学习模型性能分析工具精度批量策略复杂度功耗交叉点层级冗余深度神经网络剪枝方法分层动态矩阵遗传算法

面向AIOT板卡的推理模型无缝迁移与自适应优化方法

站点导航

APP 下载