摘要
本申请提出一种基于广播加的神经网络模型训练方法、神经网络模型,该模型训练方法包括:获取特征数据序列;针对任意一个第一特征数据,生成第一特征数据的查询向量、与多个第一特征数据一一对应的多个键向量,以及与多个第一特征数据一一对应的多个值向量;将查询向量分别与多个键向量相加得到多个相关性分数;将多个相关性分数以及多个值向量进行加权求和,得到第一特征数据对应的第二特征数据;在获取到与多个第一特征数据一一对应的多个第二特征数据后,根据多个第二特征数据对待训练神经网络模型进行训练,得到目标神经网络模型。本申请实施例能够大大减少数据计算量,进而提高神经网络模型的训练效率。
技术关键词
数据
训练神经网络模型
周期性特征
正弦波
神经网络模型训练装置
序列
注意力
模型训练方法
模型训练模块
可读存储介质
语义
存储器
处理器
指令
计算机设备