摘要
本申请提供了一种基于注意力和记忆机制的特征处理方法以及相关设备,方法包括:获取目标深度学习单元当前时刻对应的待输入数据;对当前输入数据进行编码处理和维度压缩,得到多个压缩向量;基于查询投影矩阵、键投影矩阵和值投影矩阵计算多个压缩向量对应的注意力权重,并根据多个注意力权重得到局部特征向量;基于记忆矩阵计算局部特征向量对应的多个全局特征向量,并对多个全局特征向量进行加权计算,得到多个记忆特征向量;对多个记忆特征向量进行特征融合以及维度还原,得到重构数据,以使目标深度学习单元基于重构数据进行训练,执行对应的深度学习任务,能够有效捕捉长时输入数据中的长期依赖关系,进而提高其模型性能。
技术关键词
记忆机制
注意力
矩阵
记忆单元
降维神经网络
网络异常检测
计算机可执行指令
重构
网络流量数据
数据编码
计算机设备
可读存储介质
指数
处理器
模块
程序
规模
系统为您推荐了相关专利信息
人工智能数据分析
多模态机器学习
交互式数据可视化
多层感知机
预测类别