面向AIOT板卡的推理模型无缝迁移与自适应优化方法

AITNT
正文
推荐专利
面向AIOT板卡的推理模型无缝迁移与自适应优化方法
申请号:CN202411885470
申请日期:2024-12-20
公开号:CN119987998A
公开日期:2025-05-13
类型:发明专利
摘要
本申请属于推理模型迁移与优化技术领域,涉及面向AIOT板卡的推理模型无缝迁移与自适应优化方法;使用硬件性能分析工具对AIOT设备的计算能力进行全面评估,得到硬件性能指标,对原始推理模型进行分层,并利用分析工具评估每层的性能数据,再基于硬件性能指标和模型性能数据优化模型的转换策略,确保模型在转换过程中能够考虑到硬件的限制和模型性能的需求;基于确定的转换策略对原始推理模型的转换,并将其部署到AIOT板卡上,从而达到了无缝迁移的目的;其次采用深度学习模型和实时负载监控,动态调整推理的精度、批量大小和执行路径,使得推理模型能够根据实际运行情况自适应地优化,进一步提高了模型在有限资源下的效率和性能。
技术关键词
内存 输出特征 板卡 深度学习模型 性能分析工具 精度 批量 策略 复杂度 功耗 交叉点 层级 冗余 深度神经网络 剪枝方法 分层 动态 矩阵 遗传算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号