摘要
本公开提出一种基于可微栈的推理语言模型训练、推理方法、模型及计算机设备,该方法调用待训练模型对语言的初始语义特征顺次进行多次特征提取,得到预测语义特征;计算所述预测语义特征与所述语言的标准语义特征之间的损失值;若所述损失值满足预设收敛条件,将所述待训练模型确定为目标基于可微栈的推理语言模型,所述目标基于可微栈的推理语言模型具备识别所述语言的语义特征的功能。待训练模型包括i个特征提取层,特征提取层在进行提取特征时,输入数据在只有上一特征提取层的输出数据的基础上,增加存储在预设存储单元中的数据,提高了对语言识别的准确性。
技术关键词
语义特征
存储单元
融合特征
数据
推理方法
语言模型训练方法
融合语义
计算机设备
元素
处理器通信
解码
存储器
注意力
编码
指令
矩阵
基础
系统为您推荐了相关专利信息
系统优化方法
时空注意力机制
动态知识图谱
知识点
教学
数据建模方法
通用适配器
数据拟合模型
模型更新方法
代理模型建模
任务调度方法
资源分配
电力系统
任务调度系统
整体运行效率