一种基于检索增强生成的两阶段问答对构建方法、装置

正文

推荐专利

申请号：CN202410754534

申请日期：2024-06-12

公开号：CN118780364A

公开日期：2024-10-15

类型：发明专利

摘要

本发明提供了一种基于检索增强生成的两阶段问答对构建方法、装置，包括获取待处理的行业知识和产品知识，将行业和产品知识拆分成多个单篇文章，生成文章集合，并采用预设的主题模型对文章集合进行预处理，得到多个不同主题的文章子集，基于预设的prompt输入，得到文章集合对应的话题列表，使用预设的问题改写提示工程对话题列表进行预处理，得到对应话题的问题列表；对文章子集和问题列表进行向量化处理，将处理后得到的向量化结果进行相似度计算，根据相似度计算后的文本块组装prompt，并基于大语言模型LLM生成回答对。本发明先生成特定范围内的问题，再生成答案的策略，提升了问答对的复杂度和多样性；同时，构建了文章合集，提升了问答对的丰富度。

技术关键词

问答对构建方法主题模型话题列表生成文章大语言模型文本样本阶段降维算法生成答案摘要重构数据聚类算法复杂度

系统为您推荐了相关专利信息

一种端到端的藏语字符音节级数据清洗方法

数据清洗方法字符预训练语言模型列表矫正模型

一种计算芯片和计算任务的执行方法

传输模块子模块芯片通道解析单元

一种无人叉车路径规划方法、系统、设备及介质

无人叉车障碍物栅格地图路径规划方法节点

一种基于区块链的增量式时间线工程信息提取方法及系统

信息提取方法分片分类模型识别摘要文本

注意力计算优化方法、电子设备、存储介质和程序产品

注意力矩阵分块列表非暂态计算机可读存储介质

一种基于检索增强生成的两阶段问答对构建方法、装置

站点导航

APP 下载