模型显式学习位置信息的训练方法、装置、设备及介质

正文

推荐专利

申请号：CN202510057056

申请日期：2025-01-14

公开号：CN119990365A

公开日期：2025-05-13

类型：发明专利

摘要

本发明公开了一种模型显式学习位置信息的训练方法、装置、设备及介质。所述方法应用于大模型，所述方法包括：将训练样本进行分词转换获取每个最小训练单元所对应的训练编号；将所述训练编号输入至预设深度学习模型进行模型推理获取每个所述训练编号的向量特征；通过预设激活函数将所述向量特征进行预测处理获取每个预设位置的绝对位置预测概率、相对位置预测概率以及下一训练编号的预测概率；根据自回归损失函数将所述绝对位置预测概率、所述相对位置预测概率以及所述下一训练编号的预测概率的预测结果进行训练优化。通过实施本发明的方法可解决现有技术中大模型无法有效学习位置信息的问题。

技术关键词

解码矩阵深度学习模型分词计算机设备训练装置处理器存储器介质程序指令

系统为您推荐了相关专利信息

重复文本的删除方法、装置、计算机设备、存储介质和程序产品

文本删除方法计算机设备分词 BERT模型

动力设备的故障检测方法、装置、计算机设备和存储介质

动力设备地理位置信息故障预警分析设备运行信息动态故障

一种车辆排队数量的确定方法及相关装置

车辆车道数据存储计算机程序相机

数据缺失处理方法、装置、计算机设备和可读存储介质

数据机器学习模型计算机设备计算机程序产品处理器

基于申威平台和深度学习预测电子竞技赛事结果的方法

电子竞技赛事深度学习预测申威平台深度神经网络数据

模型显式学习位置信息的训练方法、装置、设备及介质

站点导航

APP 下载