摘要
本发明提供一种基于图注意力机制与大语言模型的深度神经网络延迟方法,包括神经网络模型的结构建模,设备信息获取与增强,多层感知机预测;将待推理的深度神经网络模型M进行图注意力网络结构编码,得到模型结构表示向量,与设备表示向量,将拼接后的模型结构和设备向量表示作为模型训练收敛后的预测器的输入,输出推理延迟值。通过捕捉模型结构中并行与序列执行关系的表示机制,且能融合设备底层性能指标,实现自动化属性获取的增强机制;在小样本下依然实现高精度预测,同时具备推理性能与设备因子可解释性的统一框架,以全面提升在异构设备环境下的推理精度,适应性与可解释性。
技术关键词
延迟方法
深度神经网络模型
多层感知机
注意力机制
大语言模型
网络结构
节点
有向图结构
拼接设备
因子
融合设备
异构设备
编码器
字段
系统为您推荐了相关专利信息
语义
序列
命名实体识别方法
关系
奇异值分解重构
决策规划方法
大语言模型
轨迹
地图元素
车辆状态信息
标签分类方法
文本
大语言模型
注意力机制
梯度下降算法