摘要
本申请提供一种大语言模型多对多映射关系训练数据构造方法及相关设备,方法包括:构建种子语料,种子语料中每个样本数据的指令与回答为一对一映射关系;基于不同于种子语料的训练数据集训练逆转模型,用于接收回答并生成与回答语义相关的指令;将种子语料中的回答输入至训练好的逆转模型,生成多个与回答语义相关的指令,以将每个样本数据扩充为多对一映射关系的多个指令与同一回答;将同一回答生成的多个指令输入至大语言模型,生成与原始回答语义一致但表述不同的多个回答,以将每个样本数据扩充为多对多映射关系的多个指令与多个回答。本申请构建了指令与回答之间多对多映射的训练数据,通过该训练数据增强了模型的泛化能力与记忆能力。
技术关键词
数据构造方法
语义
大语言模型
关系
种子
计算机程序指令
样本
规则算法
计算机程序产品
处理器
电子设备
计算方法
可读存储介质
覆盖率
关键词
记忆
参数
存储器