一种语言模型的协同训练方法、系统及介质

AITNT
正文
推荐专利
一种语言模型的协同训练方法、系统及介质
申请号:CN202510769434
申请日期:2025-06-10
公开号:CN120653985A
公开日期:2025-09-16
类型:发明专利
摘要
本发明属于模型训练技术领域,公开了一种语言模型的协同训练方法、系统及介质,所述方法包括:获取电力系统的样本数据集;将样本数据集输入至预训练语言模型中进行预测,得到预测结果,所述预测结果包括:基于请求分类任务得到的检索请求的可执行检索概率以及基于检索抽取任务得到的检索结果的预测概率;基于检索请求的可执行检索概率构建请求分类任务的第一损失函数;基于检索结果的预测概率构建检索抽取任务的第二损失函数;将第一损失函数与第二损失函数进行动态结合,得到总损失函数;基于总损失函数对预训练语言模型的参数进行迭代更新,得到训练好的预训练语言模型。本发明提高了预训练语言模型收敛速度、预测精度以及泛化能力。
技术关键词
协同训练方法 预训练语言模型 文本 注意力机制 动态 样本 残差结构 语义向量 模型训练技术 电力系统 表达式 数据获取模块 训练系统 编码 标签
系统为您推荐了相关专利信息
1
一种基于工具学习的多模态共情回复生成方法
回复生成方法 生成工具 聊天机器人 字段 基座
2
一种欠驱动水下机器人预定义时间滑模控制方法
欠驱动水下机器人 滑模控制方法 径向基神经网络 水下机器人状态 数学模型
3
一种复杂动态环境下的高效运动规划方法
运动规划方法 障碍物 采样点 队列 生成轨迹
4
一种道岔三维可视化方法、装置、设备及介质
三维可视化方法 三维点云数据 道岔 高斯算法 图像
5
一种病历生成模型训练方法、装置及电子设备
病历 数据 生成模型训练方法 文本 语义向量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号