适用于异构硬件的深度神经网络模型推理延迟预测方法

AITNT
正文
推荐专利
适用于异构硬件的深度神经网络模型推理延迟预测方法
申请号:CN202411887908
申请日期:2024-12-20
公开号:CN119721252A
公开日期:2025-03-28
类型:发明专利
摘要
本发明涉及适用于异构硬件的深度神经网络模型推理延迟预测方法,包括:构建目标深度神经网络模型的通用计算图;根据所述通用计算图创建目标深度神经网络模型的有向无环图;根据通用计算图提取模型静态特征,并通过当前硬件参数提取硬件特征;利用所述有向无环图、模型静态特征和硬件特征,构建模型推理延迟预测模型。本发明的有益效果是:本发明通过精准预测深度神经网络在异构硬件上的推理延迟,企业能够优化模型部署,显著降低计算资源的浪费与运营成本。同时,精准的深度神经网络模型推理延迟预测可以优化硬件资源调度提升了硬件利用率,减少了设备采购和维护开支。
技术关键词
深度神经网络模型 静态特征 异构 节点特征 计算机存储介质 生成有向无环图 编码器模块 字典 注意力机制 非线性 预测系统 编码方法 参数 批量 矩阵
系统为您推荐了相关专利信息
1
一种遗留物品的识别方法及相关装置
物品识别模型 视频 图像 轮廓信息 对象
2
富文本文件的转换方法、装置、设备及存储介质
格式化 转换方法 文本 图片 大语言模型
3
一种基于选择性状态空间模型的红外小目标检测方法及相关装置
状态空间模型 图像 编码器 解码器 样本
4
基于双模式驱动的多智能体协作决策方法及系统
动态知识图谱 多智能体协作 协作决策 双模式 多源异构数据
5
一种基于深度神经网络的烟气脱硫设备健康状态监测方法与系统
烟气脱硫设备 记忆单元 网络结构 健康状态监测方法 小波变换去噪
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号