BERT模型的训练方法、系统、计算机设备、存储介质及程序产品

正文

推荐专利

申请号：CN202411461152

申请日期：2024-10-18

公开号：CN119441870B

公开日期：2025-12-09

类型：发明专利

摘要

本发明提供一种BERT模型的训练方法、系统、计算机设备、存储介质及程序产品，属于自然语言处理技术领域。其中方法包括利用预先构建的BERT模型以多个解码路径分别生成多个序列；将多个序列划分为正样本和负样本；利用参考模型对正样本和负样本进行采样，以构建偏好学习损失函数；构建正则惩罚项损失函数；构建掩码预测损失函数；根据偏好学习损失函数、正则惩罚项损失函数和掩码预测损失函数确定BERT模型的总损失，得到训练好的BERT模型。采用上述方案指导BERT模型学习不同解码路径对输出的影响，增强BERT模型在复杂解码空间中选择路径并生成更高质量序列的能力。

技术关键词

BERT模型样本序列计算机可执行指令 sigmoid函数计算机设备解码表达式存储计算机程序计算机程序产品训练系统处理器模块自然语言标记可读存储介质存储器策略参数

系统为您推荐了相关专利信息

一种降雨量预测方法及相关装置

降雨量预测方法视频关键帧图像像素

一种服务金融场景需求的大模型智能匹配方法及装置

智能匹配方法语义向量 BERT模型场景关键词

基于E3D-LSTM和电芯位置结构特征的电池SOC预测算法

电池 LSTM模型矩阵神经网络激活函数构建训练集

一种基于IMU的步态分割方法

加速度分割方法步态事件识别步态幅值

遥感图像传输方法、装置、电子设备及存储介质

图像块层级语义图像传输方法机器可读指令

BERT模型的训练方法、系统、计算机设备、存储介质及程序产品

站点导航

APP 下载