摘要
本发明涉及人工智能模型优化与硬件协同设计领域,尤其涉及一种基于计算图分解的人工智能模型优化方法,主要步骤包括:根据人工智能任务特点,构建任务任务‑模型映射表及计算图分解策略;构建算子‑硬件‑性能显式/隐式知识库,形成模型优化的硬件关联知识图谱;构建模型优化搜索空间,以精度最大和时延最小为目标,构建多目标优化模型;将所述多目标优化模型转换为硬件适配的模型格式,实现后处理优化。本发明从计算图分解、软硬件性能的综合知识表现及知识导引的模型搜索优化等三个层面进行创新改进,增强了人工智能模型的硬件适应能力,提高了部署效率,同时满足了精度时延约束和优化目标。
技术关键词
人工智能模型
优化求解方法
内存架构
模型库
分层特征
关系网络
图谱
时延
异构
格式
精度
策略
基准
典型
样本
基础
系统为您推荐了相关专利信息
综合评估方法
动态反馈机制
决策支持系统
水资源利用效率
环境资源技术
降噪系统
中央控制系统
声音采集模块
声音采集系统
信号
预训练模型
图像编码器
文本编码器
无监督
生成提示词
复合材料部件
超声检查设备
人工智能模型
计算机断层扫描
数据处理装置