摘要
本发明实施例公开了一种语料生成模型训练方法及装置。本发明实施例会获取多个微调样本,并根据多个微调样本对大语言模型进行指令微调,再根据指令微调后的大语言模型获取语料生成模型。其中,微调样本包括语料生成提示词和对应的微调语料,语料生成提示词包括参考信息集和语料生成指令,参考信息集中包括多个参考信息,语料生成指令用于指示大语言模型根据参考信息集生成对应语料并在生成语料中添加引用标识,引用标识用于对语料中语句与参考信息集中参考信息之间的引用关系进行标注,微调语料中添加有引用标识。由此,本发明实施例可以在模型训练过程中指引模型增强对于参考信息的关注,从而减轻语料生成模型在使用过程中所出现的文本幻觉现象。
技术关键词
生成提示词
节点
生成模型训练方法
语句
生成指令
计算机程序指令
大语言模型
样本
标识
计算机程序产品
模型训练装置
微调单元
存储计算机程序
处理器
可读存储介质
关系
电子设备
文本
系统为您推荐了相关专利信息
面向电网业务
拆分方法
卷积解码器
卷积编码器
门控神经网络
蛋白质预测方法
空间结构特征
序列特征
液相
特征提取模块
物料分拣方法
动态路径规划
蚂蚁
视觉检测装置
顶点
期望最大化算法
机器学习训练
概率密度函数
更新分类器
标记