摘要
本发明提供一种用于长序列的模型推理方法和装置,其中所述方法用于每个推理模块,包括:接收输入的长序列;将长序列分段为多个短序列,将多个短序列输入至状态空间网络层中,根据状态空间网络层的上一个状态向量序列,对输入的多个短序列进行并行推理,得到每个短序列对应的输出向量序列以及状态向量序列;将每个短序列对应的输出向量序列以及状态向量序列按顺序依次输入至子层中进行处理,得到推理模块输出的预测输出向量序列,从而实现通过状态空间网络层来维护状态向量序列,与传统的长序列处理方法需要保存每个词单元的历史状态信息相比,在保证长效记忆的同时提升大模型推理系统的计算与存储效率。
技术关键词
序列
推理方法
注意力
非暂态计算机可读存储介质
推理装置
处理器
推理系统
计算机程序产品
分段
输出模块
存储器
电子设备
记忆
系统为您推荐了相关专利信息
变化监测方法
因子
误差
计算机程序指令
监测系统
交通流量预测方法
混合核函数
噪声参数
城市智能交通管理系统
矩阵
带控制方法
导航灯
隧道
时间序列模型
交通流状态