摘要
一种用于自然语言处理任务的模型推理方法及装置、存储介质、芯片、计算机程序产品,方法包括:获取包含多个依次连接的第一子网络的初始模型,各第一子网络的网络结构一致且参数一致,上一第一子网络的输出数据是当前第一子网络的输入数据的至少一部分;采用任一第一子网络作为目标网络,并基于目标网络构建目标自然语言处理模型;基于目标自然语言处理模型及预先分配的第一目标存储空间执行多轮迭代操作;在每轮迭代中,采用目标网络上一轮的输出数据对第一目标存储空间中的数据进行更新,基于更新后数据确定当前轮的输入数据并输入目标网络,得到目标网络当前轮的输出数据,直至满足迭代终止条件时确定推理结果。上述方案可以提高模型推理性能。
技术关键词
自然语言
推理方法
数据
计算机程序产品
网络结构
编码模块
嵌入式芯片
推理装置
处理器
注意力
序列
解码模块
参数
存储器
连网
内存
系统为您推荐了相关专利信息
边界特征
梯度下降算法
计算方法
多边形
光学投影系统
预测模型训练
卷积人工神经网络
递归神经网络
预测序列数据
数据收集模块
溢流风险
卫星遥感数据
评估系统
加权平均法
地面监测站
腐蚀速率预测方法
灰狼算法
BP神经网络模型
网络拓扑结构
误差