一种面向大模型问答系统的文件解析与知识召回方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510283215

申请日期：2025-03-11

公开号：CN120386854A

公开日期：2025-07-29

类型：发明专利

摘要

本申请公开一种面向大模型问答系统的文件解析与知识召回方法、装置、设备及存储介质。本申请中的方法包括：对文档进行解析，提取细粒度信息；接收自然语言查询请求，生成包含相似问题的问题文本；对问题文本进行关键词提取和权重分配，生成关键词权重映射；使用关键词权重基于BM25算法，计算不同文档与问题文本的相似度评分，初步筛选与相似问题相关联的文档；在初筛的文档内，精确查询具体的片段；对具体片段进行平滑处理，并对最终的结果按照片段的综合得分排序后返回。本申请降低了问答系统的运营成本，提高了细粒度信息的分析能力，能够使用户在查询时精准定位到所需的具体信息，提高了检索效率和准确率。

技术关键词

召回方法问答系统生成关键词文本归一化方法退火算法分词方法自然语言同义词生成候选词字段词频统计索引阶段模块处理器线性

系统为您推荐了相关专利信息

图节点分类模型的训练方法、图节点分类方法及相关设备

拓扑特征标签节点分类方法文本分类模型训练样本集

一种唇形确定方法、装置、设备、存储介质和程序产品

关键帧时间段文本插值算法数据

图像生成方法、装置及电子设备

文本多层感知机图像生成方法分布直方图样本

一种防火阀安装合规性的检查方法

防火阀三元组检查方法合规性拐角

一种多模型集成的稀缺资源信息抽取方法、装置及设备

信息抽取模型信息抽取方法文本样本字典结构

一种面向大模型问答系统的文件解析与知识召回方法、装置、设备及存储介质

站点导航

APP 下载