基于可微栈的推理语言模型训练、推理方法、模型及计算机设备

正文

推荐专利

申请号：CN202510299199

申请日期：2025-03-13

公开号：CN120430398A

公开日期：2025-08-05

类型：发明专利

摘要

本公开提出一种基于可微栈的推理语言模型训练、推理方法、模型及计算机设备，该方法调用待训练模型对语言的初始语义特征顺次进行多次特征提取，得到预测语义特征；计算所述预测语义特征与所述语言的标准语义特征之间的损失值；若所述损失值满足预设收敛条件，将所述待训练模型确定为目标基于可微栈的推理语言模型，所述目标基于可微栈的推理语言模型具备识别所述语言的语义特征的功能。待训练模型包括i个特征提取层，特征提取层在进行提取特征时，输入数据在只有上一特征提取层的输出数据的基础上，增加存储在预设存储单元中的数据，提高了对语言识别的准确性。

技术关键词

语义特征存储单元融合特征数据推理方法语言模型训练方法融合语义计算机设备元素处理器通信解码存储器注意力编码指令矩阵基础

系统为您推荐了相关专利信息

基于BIM的资产模型信息高效赋值一体化平台

一体化平台数据验证 Revit软件房间资产

一种基于本地知识库与AI关联的教学应用系统优化方法

系统优化方法时空注意力机制动态知识图谱知识点教学

一种基于样机适配器的数据建模方法

数据建模方法通用适配器数据拟合模型模型更新方法代理模型建模

基于电力大数据模型的任务调度方法及系统

任务调度方法资源分配电力系统任务调度系统整体运行效率

一种考虑设备功率与物料消耗关系的企业碳排放监测方法及系统

碳排放监测方法排放量功率企业生产流程关系

基于可微栈的推理语言模型训练、推理方法、模型及计算机设备

站点导航

APP 下载