摘要
本发明提供一种模型首字推理方法及装置,所述方法包括:获取模型的计算图,并从计算图中确定模型的末个注意力模块所在的计算子图;在计算子图中添加剪切节点,基于添加剪切节点后的计算子图,应用输入文本,进行模型首字推理,得到首字推理结果;剪切节点位于上一计算子图的输出节点之后,剪切节点用于在每个批次的行维度上对上一节点的输出进行剪切操作。本发明将剪切节点设置于上一计算子图的输出节点之后,从而剪切节点能够在每个批次的行维度上对上一节点的输出进行剪切操作,不仅能够去除冗余计算,提高首字推理效率,且去除冗余计算后也不会影响首字推理结果的计算精度。
技术关键词
推理方法
节点
注意力
图形处理器
非暂态计算机可读存储介质
文本
推理装置
计算机程序产品
模块
中央处理器
冗余
存储器
阶段
电子设备
解码
系统为您推荐了相关专利信息
营养分析方法
智能食物
深度卷积神经网络预测
深度图
生成场景
通信网络节点
通信网络故障分析
救援场景
通信终端
多路径效应