摘要
本发明提供一种注意力机制计算和模型推理方法、装置、设备及介质,其中方法包括:将序列分为多个片段,为各片段分配处理节点,控制各处理节点分别计算与处理节点对应的片段在完整隐层维度上的注意力向量;控制各处理节点之间传输注意力向量,在各处理节点处得到序列在部分隐层维度上的注意力向量;控制各处理节点分别基于序列在部分隐层维度上的注意力向量进行注意力机制计算,在各处理节点处分别得到序列在部分隐层维度上的计算结果;控制各处理节点之间传输计算结果,在各处理节点处得到各片段在完整隐层维度上的注意力计算结果。本发明提供的方法、装置、设备及介质,能够提升的注意力机制的计算效率,并降低模型结构的敏感度,通用性更强。
技术关键词
注意力机制
节点处
计算方法
推理方法
序列
处理单元
传输模块
推理装置
处理器
计算机程序产品
介质
存储器
电子设备
系统为您推荐了相关专利信息
智能回收方法
LSTM神经网络
热转移
供热系统
供热管网系统
应力
波动特征
控制机械臂运动
幕墙
定位安装方法
数据分析方法
资金
离散小波变换
识别用户意图
数据分析模块
能源管理优化方法
微电网
决策
时序预测模型
深度强化学习算法