一种语言模型训练方法、语言模型推理方法及相关装置

AITNT
正文
推荐专利
一种语言模型训练方法、语言模型推理方法及相关装置
申请号:CN202510401258
申请日期:2025-03-31
公开号:CN120338104A
公开日期:2025-07-18
类型:发明专利
摘要
本申请提供了一种语言模型训练方法、语言模型推理方法及相关装置,该方法包括:获取至少一个对象属性;针对至少一个对象属性中的每个对象属性,执行以下步骤:构造至少一个决策树;其中,决策树的叶节点衡量该对象属性的属性值;将包括该对象属性以及该对象属性的属性值的文本作为训练数据,对第一语言模型进行预训练,确定至少一个决策树的叶节点对应的嵌入向量。在该方法中,利用决策树表示该对象属性下的不同对象属性值与对应的嵌入向量在语言模型的输入层所在位置之间的关系,同一对象属性值出现在不同对象属性中有不同的嵌入向量,使得嵌入向量更能够表征在特定对象属性中的特定含义。
技术关键词
对象 语言模型训练方法 随机森林 节点 推理方法 文本 计算机可读指令 计算机程序产品 注意力机制 索引 电子设备 模型训练装置 推理装置 分词 通信模块 可读存储介质 存储器 数据 处理器
系统为您推荐了相关专利信息
1
HIV传染源追踪与干预策略的多模态网络融合方法及系统
关键节点识别 多模态网络 网络融合方法 人类免疫缺陷病毒 节点特征
2
一种单元格类型获取方法和系统
大语言模型 节点 注意力 关系 表格
3
油气管线全生命周期安全状态智能监测方法及系统
数字孪生模型 状态智能监测方法 注意力机制 多维特征向量 数据
4
区块链物联微网系统
通信模组 控制管理系统 神经网络数据挖掘 微处理器 电力
5
数据库二维表的可查询压缩方法
条目 离散化模型 重构条件 数值 孩子
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号