一种面向NPU计算架构的神经网络推理性能分析方法

AITNT
正文
推荐专利
一种面向NPU计算架构的神经网络推理性能分析方法
申请号:CN202511097657
申请日期:2025-08-06
公开号:CN120611352B
公开日期:2025-10-14
类型:发明专利
摘要
本发明涉及神经网络推理性能分析技术领域,公开了一种面向NPU计算架构的神经网络推理性能分析方法,该方法获取原始数据并标准化,提取计算单元、任务及架构负载特征生成性能特征向量,识别推理性能需求得到初步分析结果;整合初步结果与标准化数据生成增强型分析矩阵,多维度解析性能,计算必要性分数和架构影响值,经多重验证得到决策数据;结合NPU计算特征库和决策数据构建增强计算特征空间,进行计算匹配与参数优化,优化推理路径并预检验;采集执行数据流和历史监控数据生成综合监控数据包,进行异常检测、预警及动态优化。该方法提升网络推理性能分析的准确性与效率,实现推理过程的动态优化与自适应调整。
技术关键词
神经网络推理 性能分析方法 上下文特征 资源需求数据 策略 矩阵 关联特征数据 决策 序列 调度特征 时序 风险 模式 负载特征 资源特征 容错机制 生成资源 静态特征
系统为您推荐了相关专利信息
1
一种分布式配电网智慧终端设备的自适应管理方法及系统
中央管理单元 终端设备 分布式配电网 管理方法 分布式电源出力
2
一种智能制造系统动态调度方法
动态调度方法 指数 机器学习模型 表达式 智能调度技术
3
基于预训练注意力编码器的无人机集群干扰资源分配方法
训练注意力 干扰资源分配方法 无人机集群协同 编码器 残差网络
4
信息风险管控方法及系统
分布式存储集群 风险管控系统 密钥管理 分析器 代表
5
一种基于帧重采样和子带剪枝的轻量化语音增强方法
语音识别场景 上采样 自动语音识别 层级 策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号