基于TensorFlow的NPU模型优化方法、装置及存储介质

正文

推荐专利

申请号：CN202510629512

申请日期：2025-05-16

公开号：CN120145888A

公开日期：2025-06-13

类型：发明专利

摘要

本发明涉及基于TensorFlow的NPU模型优化方法、装置及存储介质，其中方法包括模型解析模块读取并提取TensorFlow模型的结构和参数；模型转换模块将TensorFlow模型转换为NPU支持的中间表示；通过算子融合、内存优化和量化，所述模型优化模块优化转换后的TensorFlow模型，将优化后的TensorFlow模型部署到NPU执行模块；性能监控模块监控TensorFlow模型在NPU上的运行性能，并输出性能数据。本发明提供高效的模型转换工具，快速将TensorFlow模型转换为NPU支持的格式，提高模型转换效率；充分利用NPU的低精度计算、并行计算等硬件特性，提升计算效率，通过算子融合、内存优化和量化等手段，减少转换时间和开发成本；减少开发者的手动操作，简化模型部署流程，降低部署难度；支持大规模模型部署，满足实际应用需求。

技术关键词

TensorFlow模型模型优化方法优化装置性能监控内存访问模式自定义算子子模块精度参数可读存储介质数据动态程序指令冗余功耗格式计算机

基于TensorFlow的NPU模型优化方法、装置及存储介质

站点导航

APP 下载