大语言模型多对多映射关系训练数据构造方法及相关设备

正文

推荐专利

申请号：CN202510627309

申请日期：2025-05-15

公开号：CN120541523A

公开日期：2025-08-26

类型：发明专利

摘要

本申请提供一种大语言模型多对多映射关系训练数据构造方法及相关设备，方法包括：构建种子语料，种子语料中每个样本数据的指令与回答为一对一映射关系；基于不同于种子语料的训练数据集训练逆转模型，用于接收回答并生成与回答语义相关的指令；将种子语料中的回答输入至训练好的逆转模型，生成多个与回答语义相关的指令，以将每个样本数据扩充为多对一映射关系的多个指令与同一回答；将同一回答生成的多个指令输入至大语言模型，生成与原始回答语义一致但表述不同的多个回答，以将每个样本数据扩充为多对多映射关系的多个指令与多个回答。本申请构建了指令与回答之间多对多映射的训练数据，通过该训练数据增强了模型的泛化能力与记忆能力。

技术关键词

数据构造方法语义大语言模型关系种子计算机程序指令样本规则算法计算机程序产品处理器电子设备计算方法可读存储介质覆盖率关键词记忆参数存储器

大语言模型多对多映射关系训练数据构造方法及相关设备

站点导航

APP 下载