模型显式学习位置信息的训练方法、装置、设备及介质

AITNT
正文
推荐专利
模型显式学习位置信息的训练方法、装置、设备及介质
申请号:CN202510057056
申请日期:2025-01-14
公开号:CN119990365A
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开了一种模型显式学习位置信息的训练方法、装置、设备及介质。所述方法应用于大模型,所述方法包括:将训练样本进行分词转换获取每个最小训练单元所对应的训练编号;将所述训练编号输入至预设深度学习模型进行模型推理获取每个所述训练编号的向量特征;通过预设激活函数将所述向量特征进行预测处理获取每个预设位置的绝对位置预测概率、相对位置预测概率以及下一训练编号的预测概率;根据自回归损失函数将所述绝对位置预测概率、所述相对位置预测概率以及所述下一训练编号的预测概率的预测结果进行训练优化。通过实施本发明的方法可解决现有技术中大模型无法有效学习位置信息的问题。
技术关键词
解码矩阵 深度学习模型 分词 计算机设备 训练装置 处理器 存储器 介质 程序 指令
系统为您推荐了相关专利信息
1
重复文本的删除方法、装置、计算机设备、存储介质和程序产品
文本 删除方法 计算机设备 分词 BERT模型
2
动力设备的故障检测方法、装置、计算机设备和存储介质
动力设备 地理位置信息 故障预警分析 设备运行信息 动态故障
3
一种车辆排队数量的确定方法及相关装置
车辆 车道 数据 存储计算机程序 相机
4
数据缺失处理方法、装置、计算机设备和可读存储介质
数据 机器学习模型 计算机设备 计算机程序产品 处理器
5
基于申威平台和深度学习预测电子竞技赛事结果的方法
电子竞技赛事 深度学习预测 申威平台 深度神经网络 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号