摘要
本发明实施例公开了一种可扩展的高效算力芯片性能分析框架,其采用前后端分离模式,包括:前端,用于收集算力芯片配置信息、算子信息及用户配置信息;后端,用于进行预设模块修改、算子种类扩展及芯片性能评估。本发明通过对后端内部模块的改进,可成功解决现有技术在算子开发或性能评估阶段无法快速获取多种运行时间的难题,使得算子开发者能够更加准确地把握算子优化的方向,大大提高了开发效率和质量。同时,本发明还支持通过直接修改配置文件来获得不同配置情况下的各算子执行时间,使得大模型厂商快速找到最佳的模型架构和算力芯片组合、云计算和数据中心运行高效选择最优算力芯片配置、为算力芯片的设计空间探索提供了极大的便利。
技术关键词
芯片架构
芯片模块
框架
解析器
指标自定义
任务分配策略
修改配置文件
多头注意力机制
数据采集接口
众核架构
基线
专业
异构
数据中心
矩阵
数学
图像处理
系统为您推荐了相关专利信息
滑动时间窗口
筛选方法
神经网络模型
轨道
结构构建方法
充电站规划方法
灰狼算法
多策略
求解算法
计算机可执行指令
动态管控方法
WebSocket协议
异步分发
状态更新
物流
深度强化学习
虚拟网络
决策方法
资源约束条件
节点