基于可微栈的推理语言模型训练、推理方法、模型及计算机设备

AITNT
正文
推荐专利
基于可微栈的推理语言模型训练、推理方法、模型及计算机设备
申请号:CN202510299199
申请日期:2025-03-13
公开号:CN120430398A
公开日期:2025-08-05
类型:发明专利
摘要
本公开提出一种基于可微栈的推理语言模型训练、推理方法、模型及计算机设备,该方法调用待训练模型对语言的初始语义特征顺次进行多次特征提取,得到预测语义特征;计算所述预测语义特征与所述语言的标准语义特征之间的损失值;若所述损失值满足预设收敛条件,将所述待训练模型确定为目标基于可微栈的推理语言模型,所述目标基于可微栈的推理语言模型具备识别所述语言的语义特征的功能。待训练模型包括i个特征提取层,特征提取层在进行提取特征时,输入数据在只有上一特征提取层的输出数据的基础上,增加存储在预设存储单元中的数据,提高了对语言识别的准确性。
技术关键词
语义特征 存储单元 融合特征 数据 推理方法 语言模型训练方法 融合语义 计算机设备 元素 处理器通信 解码 存储器 注意力 编码 指令 矩阵 基础
系统为您推荐了相关专利信息
1
基于BIM的资产模型信息高效赋值一体化平台
一体化平台 数据验证 Revit软件 房间 资产
2
一种基于本地知识库与AI关联的教学应用系统优化方法
系统优化方法 时空注意力机制 动态知识图谱 知识点 教学
3
一种基于样机适配器的数据建模方法
数据建模方法 通用适配器 数据拟合模型 模型更新方法 代理模型建模
4
基于电力大数据模型的任务调度方法及系统
任务调度方法 资源分配 电力系统 任务调度系统 整体运行效率
5
一种考虑设备功率与物料消耗关系的企业碳排放监测方法及系统
碳排放监测方法 排放量 功率 企业生产流程 关系
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号