摘要
本发明涉及计算机语言处理技术领域,特别是一种共享记忆矩阵的语言模型使用方法。通过一种循环的迭代结构,将Key矩阵、Value矩阵都通过memory得到,同时保证在推理当前token过程中每层的memory都相同,等效于key张量、value张量共享,从而实现了缓存降低的效果,因而算力资源得到了节省。
技术关键词
文本
前馈神经网络
注意力
矩阵
记忆
列表
训练集
分词
解码
计算机
输出端
阶段
定义
资源
系统为您推荐了相关专利信息
动物机器人
大语言模型
语义地图
导航系统
专家控制系统
音频特征
声音事件检测方法
特征提取网络
事件检测模型
交叉注意力机制
情绪识别方法
融合特征
语音特征
视觉特征
注意力
隧道内车辆
隧道监控
运动特征
训练深度神经网络
车辆运动状态