摘要
本发明公开了一种面向移动端异构平台多推理框架的延迟开销预测方法,包括:步骤1、获取原始模型,得到原始模型中配置相似的卷积算子,对配置相似的卷积算子进行分组合并;步骤2、针对不同推理平台的卷积算子推理特性分别进行延迟开销预测模型建模;然后等比例推知模型的整体延迟;步骤3、对移动端异构硬件进行内核的自定义、编译和刷入,并确认推理框架、推理部件、核心种类、核心;步骤4、针对不同配置间的的延迟开销预测模型进行快速迁移。本发明解决了现有移动端异构设备在面对多样的推理平台和推理配置、推理模型,由软硬件多样性带来的延迟开销预测建模困难、精度低的问题。
技术关键词
推理平台
异构平台
移动端
核心
阶梯
框架
曲线斜率
内核
通道
频率
分段
台阶
双线性
外挂模块
端点
异构设备
预测建模
采样点
系统为您推荐了相关专利信息
智能分拣系统
连续输送系统
收集系统
生成系统
富集
多模态深度学习
MHCI类分子
卷积神经网络模块
交叉注意力机制
通道注意力机制
深度学习网络模型
分析方法
训练集
融合特征
物理