摘要
公开了一种模型推理方法和装置。该方法包括:对输入文本进行预处理以将其转换为语义向量序列;通过降维映射和键‑值映射,计算语义向量序列对应的压缩键和压缩值矩阵并将其存入预设缓存空间中;响应于循环结束条件未被满足,循环执行下述步骤:基于针对目标语义向量以及预设缓存空间中存储的压缩键和压缩值矩阵的第一线性变换,计算当前注意力表示;基于当前注意力表示生成新语义向量并更新语义向量序列;通过降维映射和键‑值映射,计算新语义向量对应的压缩键向量和压缩值向量并更新压缩键矩阵和压缩值矩阵。根据本申请的模型推理方法可以在保证模型推理效果和性能的同时显著提升推理效率。
技术关键词
语义向量
矩阵
序列
多头注意力机制
推理方法
文本
计算机可读指令
前馈神经网络
推理装置
计算机程序产品
处理器
分块
可读存储介质
存储器
模块
分词
字符
系统为您推荐了相关专利信息
靶机
鲁棒控制系统
求解线性矩阵
方向舵
误差模型
异常检测方法
宽度学习系统
参数优化算法
广义
变量
选区激光熔化
路径优化方法
平衡二叉树
蚁群算法
三维模型