面向移动端异构平台多推理框架的延迟开销预测方法

AITNT
正文
推荐专利
面向移动端异构平台多推理框架的延迟开销预测方法
申请号:CN202511049029
申请日期:2025-07-29
公开号:CN120973645A
公开日期:2025-11-18
类型:发明专利
摘要
本发明公开了一种面向移动端异构平台多推理框架的延迟开销预测方法,包括:步骤1、获取原始模型,得到原始模型中配置相似的卷积算子,对配置相似的卷积算子进行分组合并;步骤2、针对不同推理平台的卷积算子推理特性分别进行延迟开销预测模型建模;然后等比例推知模型的整体延迟;步骤3、对移动端异构硬件进行内核的自定义、编译和刷入,并确认推理框架、推理部件、核心种类、核心;步骤4、针对不同配置间的的延迟开销预测模型进行快速迁移。本发明解决了现有移动端异构设备在面对多样的推理平台和推理配置、推理模型,由软硬件多样性带来的延迟开销预测建模困难、精度低的问题。
技术关键词
推理平台 异构平台 移动端 核心 阶梯 框架 曲线斜率 内核 通道 频率 分段 台阶 双线性 外挂模块 端点 异构设备 预测建模 采样点
系统为您推荐了相关专利信息
1
口岸大宗粮谷杂草生物静电富集分拣装置
智能分拣系统 连续输送系统 收集系统 生成系统 富集
2
一种基于大语言模型的代码翻译的方法和装置
大语言模型 代码库 工作流 节点 生成工具
3
一种检索方法、检索设备
核心 大语言模型 同义词 检索设备 检索方法
4
基于多模态深度学习的MHC提呈肽段预测方法及系统
多模态深度学习 MHCI类分子 卷积神经网络模块 交叉注意力机制 通道注意力机制
5
一种XPS谱图分析方法、系统、计算机设备及介质
深度学习网络模型 分析方法 训练集 融合特征 物理
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号