摘要
本申请实施例提供了一种大语言模型的训练方法、问答处理方法及装置,该方法包括:获取多个样本,每个样本包括样本问题、样本问题对应的第一答案和第二答案,根据各样本中每个答案的词元与另一答案的词元之间的相似度,确定每个答案中的词元的权重,对于每个样本,将该样本问题输入到大语言模型中,得到第一概率分布和第二概率分布,根据第一答案的各个词元的权重,对第一概率分布中各第一词元的概率进行加权,根据第二答案的各个词元的权重,对第二概率分布中各第二词元的概率进行加权,根据各样本对应的加权后的第一概率分布与加权后的第二概率分布之间的差异,对大语言模型中的模型参数进行调整。基于该方法,有效提高了模型输出答案的质量。
技术关键词
答案
样本
大语言模型
关键词
特征提取模型
计算机程序产品
处理器
训练装置
电子设备
分词
模块
可读存储介质
存储器
参数
编码