一种用于长序列的模型推理方法和装置

AITNT
正文
推荐专利
一种用于长序列的模型推理方法和装置
申请号:CN202411440909
申请日期:2024-10-15
公开号:CN119168072A
公开日期:2024-12-20
类型:发明专利
摘要
本发明提供一种用于长序列的模型推理方法和装置,其中所述方法用于每个推理模块,包括:接收输入的长序列;将长序列分段为多个短序列,将多个短序列输入至状态空间网络层中,根据状态空间网络层的上一个状态向量序列,对输入的多个短序列进行并行推理,得到每个短序列对应的输出向量序列以及状态向量序列;将每个短序列对应的输出向量序列以及状态向量序列按顺序依次输入至子层中进行处理,得到推理模块输出的预测输出向量序列,从而实现通过状态空间网络层来维护状态向量序列,与传统的长序列处理方法需要保存每个词单元的历史状态信息相比,在保证长效记忆的同时提升大模型推理系统的计算与存储效率。
技术关键词
序列 推理方法 注意力 非暂态计算机可读存储介质 推理装置 处理器 推理系统 计算机程序产品 分段 输出模块 存储器 电子设备 记忆
系统为您推荐了相关专利信息
1
基于传感器断点检测的水下智慧管网故障检测方法及系统
故障传感器 智慧管网 故障检测方法 外延 断点
2
基于数控纤维缠绕的多轴联动缠绕质量监测设备
分段 监测设备 缠绕成型工艺 数据 纤维
3
一种金属原料熔融过程中的温度变化监测系统及方法
变化监测方法 因子 误差 计算机程序指令 监测系统
4
一种基于THK-BLO-SVR的交通流量预测方法
交通流量预测方法 混合核函数 噪声参数 城市智能交通管理系统 矩阵
5
隧道内部智能导航灯带控制方法及系统
带控制方法 导航灯 隧道 时间序列模型 交通流状态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号