大语言模型的训练方法、问答处理方法及装置

正文

推荐专利

申请号：CN202510958272

申请日期：2025-07-10

公开号：CN120873129A

公开日期：2025-10-31

类型：发明专利

摘要

本申请实施例提供了一种大语言模型的训练方法、问答处理方法及装置，该方法包括：获取多个样本，每个样本包括样本问题、样本问题对应的第一答案和第二答案，根据各样本中每个答案的词元与另一答案的词元之间的相似度，确定每个答案中的词元的权重，对于每个样本，将该样本问题输入到大语言模型中，得到第一概率分布和第二概率分布，根据第一答案的各个词元的权重，对第一概率分布中各第一词元的概率进行加权，根据第二答案的各个词元的权重，对第二概率分布中各第二词元的概率进行加权，根据各样本对应的加权后的第一概率分布与加权后的第二概率分布之间的差异，对大语言模型中的模型参数进行调整。基于该方法，有效提高了模型输出答案的质量。

技术关键词

答案样本大语言模型关键词特征提取模型计算机程序产品处理器训练装置电子设备分词模块可读存储介质存储器参数编码

大语言模型的训练方法、问答处理方法及装置

站点导航

APP 下载