一种语言模型的协同训练方法、系统及介质

正文

推荐专利

一种语言模型的协同训练方法、系统及介质

申请号：CN202510769434

申请日期：2025-06-10

公开号：CN120653985A

公开日期：2025-09-16

类型：发明专利

摘要

本发明属于模型训练技术领域，公开了一种语言模型的协同训练方法、系统及介质，所述方法包括：获取电力系统的样本数据集；将样本数据集输入至预训练语言模型中进行预测，得到预测结果，所述预测结果包括：基于请求分类任务得到的检索请求的可执行检索概率以及基于检索抽取任务得到的检索结果的预测概率；基于检索请求的可执行检索概率构建请求分类任务的第一损失函数；基于检索结果的预测概率构建检索抽取任务的第二损失函数；将第一损失函数与第二损失函数进行动态结合，得到总损失函数；基于总损失函数对预训练语言模型的参数进行迭代更新，得到训练好的预训练语言模型。本发明提高了预训练语言模型收敛速度、预测精度以及泛化能力。

技术关键词

协同训练方法预训练语言模型文本注意力机制动态样本残差结构语义向量模型训练技术电力系统表达式数据获取模块训练系统编码标签

系统为您推荐了相关专利信息

一种基于工具学习的多模态共情回复生成方法

回复生成方法生成工具聊天机器人字段基座

一种欠驱动水下机器人预定义时间滑模控制方法

欠驱动水下机器人滑模控制方法径向基神经网络水下机器人状态数学模型

一种复杂动态环境下的高效运动规划方法

运动规划方法障碍物采样点队列生成轨迹

一种道岔三维可视化方法、装置、设备及介质

三维可视化方法三维点云数据道岔高斯算法图像

一种病历生成模型训练方法、装置及电子设备

病历数据生成模型训练方法文本语义向量

一种语言模型的协同训练方法、系统及介质

站点导航

APP 下载