针对大语言模型的同类信息生成任务的训练方法及装置

正文

推荐专利

申请号：CN202510349501

申请日期：2025-03-21

公开号：CN120297273A

公开日期：2025-07-11

类型：发明专利

摘要

本说明书实施例提供针对大语言模型的同类信息生成任务的训练方法及装置，在利用大语言模型生成同类信息(如测试用例/样例、问答样本、近义表达等等)的情况下，可以使用种子信息和对应的标签信息作为训练样本，针对大语言模型处理种子信息得到的生成结果，一方面，通过大语言模型生成结果与标签信息比较，确定生成损失，另一方面，利用大语言模型生成同类信息过程中得到的概率分布进行连续化映射处理，根据处理结果得到相应词汇嵌入向量用于对生成结果进行质量检测，并确定质量损失。最终确定大语言模型的模型损失包括生成损失和质量损失，根据模型损失调整大语言模型的相关模型参数，可以使得大语言模型具备完成生成同类信息任务的能力。

技术关键词

大语言模型问答匹配模型标签种子答案参数训练装置周期计算机可读存储介质存储器处理器元素样本矩阵数据

系统为您推荐了相关专利信息

基于大语言模型和自适应知识图谱的数据治理方法、模型、系统、产品及设备

数据治理方法大语言模型知识图谱数据处理坐标系数据治理系统

反射放大电路、芯片、射频标签和电子设备

输入输出模块直流偏置模块晶闸管阻抗匹配模块生成反射信号

数据脱敏方法、装置、介质和系统

脱敏数据国密算法加密算法数据脱敏方法身份证号

一种空间金字塔池化与上采样方式优化的图像识别方法

空间金字塔图像识别方法图像识别系统网络模型训练退火算法

一种基于RCM设备可靠性检修策略的动态物资管理系统及方法

物资管理系统检修策略预测设备故障设备运行环境动态

针对大语言模型的同类信息生成任务的训练方法及装置

站点导航

APP 下载