一种语言模型训练方法、语言模型推理方法及相关装置

正文

推荐专利

申请号：CN202510401258

申请日期：2025-03-31

公开号：CN120338104A

公开日期：2025-07-18

类型：发明专利

摘要

本申请提供了一种语言模型训练方法、语言模型推理方法及相关装置，该方法包括：获取至少一个对象属性；针对至少一个对象属性中的每个对象属性，执行以下步骤：构造至少一个决策树；其中，决策树的叶节点衡量该对象属性的属性值；将包括该对象属性以及该对象属性的属性值的文本作为训练数据，对第一语言模型进行预训练，确定至少一个决策树的叶节点对应的嵌入向量。在该方法中，利用决策树表示该对象属性下的不同对象属性值与对应的嵌入向量在语言模型的输入层所在位置之间的关系，同一对象属性值出现在不同对象属性中有不同的嵌入向量，使得嵌入向量更能够表征在特定对象属性中的特定含义。

技术关键词

对象语言模型训练方法随机森林节点推理方法文本计算机可读指令计算机程序产品注意力机制索引电子设备模型训练装置推理装置分词通信模块可读存储介质存储器数据处理器

系统为您推荐了相关专利信息

HIV传染源追踪与干预策略的多模态网络融合方法及系统

关键节点识别多模态网络网络融合方法人类免疫缺陷病毒节点特征

一种单元格类型获取方法和系统

大语言模型节点注意力关系表格

油气管线全生命周期安全状态智能监测方法及系统

数字孪生模型状态智能监测方法注意力机制多维特征向量数据

区块链物联微网系统

通信模组控制管理系统神经网络数据挖掘微处理器电力

数据库二维表的可查询压缩方法

条目离散化模型重构条件数值孩子

一种语言模型训练方法、语言模型推理方法及相关装置

站点导航

APP 下载