摘要
本发明公开了一种模型显式学习位置信息的训练方法、装置、设备及介质。所述方法应用于大模型,所述方法包括:将训练样本进行分词转换获取每个最小训练单元所对应的训练编号;将所述训练编号输入至预设深度学习模型进行模型推理获取每个所述训练编号的向量特征;通过预设激活函数将所述向量特征进行预测处理获取每个预设位置的绝对位置预测概率、相对位置预测概率以及下一训练编号的预测概率;根据自回归损失函数将所述绝对位置预测概率、所述相对位置预测概率以及所述下一训练编号的预测概率的预测结果进行训练优化。通过实施本发明的方法可解决现有技术中大模型无法有效学习位置信息的问题。
技术关键词
解码矩阵
深度学习模型
分词
计算机设备
训练装置
处理器
存储器
介质
程序
指令
系统为您推荐了相关专利信息
动力设备
地理位置信息
故障预警分析
设备运行信息
动态故障
数据
机器学习模型
计算机设备
计算机程序产品
处理器
电子竞技赛事
深度学习预测
申威平台
深度神经网络
数据