摘要
本说明书实施例提供针对大语言模型的同类信息生成任务的训练方法及装置,在利用大语言模型生成同类信息(如测试用例/样例、问答样本、近义表达等等)的情况下,可以使用种子信息和对应的标签信息作为训练样本,针对大语言模型处理种子信息得到的生成结果,一方面,通过大语言模型生成结果与标签信息比较,确定生成损失,另一方面,利用大语言模型生成同类信息过程中得到的概率分布进行连续化映射处理,根据处理结果得到相应词汇嵌入向量用于对生成结果进行质量检测,并确定质量损失。最终确定大语言模型的模型损失包括生成损失和质量损失,根据模型损失调整大语言模型的相关模型参数,可以使得大语言模型具备完成生成同类信息任务的能力。
技术关键词
大语言模型
问答匹配模型
标签
种子
答案
参数
训练装置
周期
计算机
可读存储介质
存储器
处理器
元素
样本
矩阵
数据
系统为您推荐了相关专利信息
数据治理方法
大语言模型
知识图谱数据处理
坐标系
数据治理系统
输入输出模块
直流偏置模块
晶闸管
阻抗匹配模块
生成反射信号
脱敏数据
国密算法
加密算法
数据脱敏方法
身份证号
空间金字塔
图像识别方法
图像识别系统
网络模型训练
退火算法
物资管理系统
检修策略
预测设备故障
设备运行环境
动态