摘要
本公开涉及一种数据推理方法、网络设备、介质、电子设备和程序产品,属于计算机技术领域,能够解决带宽瓶颈,降低时延,提高系统性能。一种数据推理方法,包括:从多个节点接收初始注意力向量,初始注意力向量包括多个初始元素;确定网络设备本地保存的包括多个本地元素的本地注意力向量;由网络设备的流水线级中的j‑1、j、j+1和j+2执行本地元素i与相应初始元素的聚合,j‑1级确定初始元素的加权值并存储在HPV中,j级从其内存中读取本地元素i并存储到HPV中,j+1级确定本地元素i的加权值并存储在HPV中,j+2级基于本地元素i和初始元素的加权值对本地元素i与初始元素进行聚合得到目标注意力向量中的第i个元素,目标注意力向量被用于进行数据推理。
技术关键词
注意力
数据推理方法
元素
流水线
包头
推理系统
网络设备上执行
节点
内存
电子设备
计算机程序产品
处理器
可读存储介质
存储器
序列
时延
系统为您推荐了相关专利信息
文件评估方法
LSTM模型
BERT模型
深度学习模型
图像特征向量
服装
重识别方法
文本编码器
行人重识别
计算机存储介质
图像语义分割方法
深度信息融合
图像编码器
图像嵌入
令牌