摘要
本申请公开LLM‑RAG样本的构建方法、设备及存储介质,该方法包括:确定与输入内容相匹配的多个泛化问题和相应的参考答案;针对各个泛化问题,将泛化问题在输入文档中进行信息检索,以确定相应的召回背景知识;根据各个泛化问题与相应的参考答案和召回背景知识,生成相应的关于LLM‑RAG的各个结构化样本。由此,通过以输入文档为基础,构建覆盖多种语义表达形式的泛化问题及对应参考答案,并引入检索召回机制从输入文档获取关联背景知识,从而生成内容完整、语义一致的结构化样本,显著提升了LLM‑RAG训练数据的质量与适用性。
技术关键词
样本
大语言模型
信息检索
语义
计算机程序产品
基础
处理器通信
指令
存储器
电子设备
答案
专业
逻辑
数据
机制
系统为您推荐了相关专利信息
故障预测数据
故障诊断模型
双向长短期记忆
故障诊断方法
注意力机制
遥感图像分割方法
特征提取网络
语义
天气
Sigmoid函数
空间结构特征
修复方法
编码向量
生成多尺度
身份