摘要
本发明为一种基于后分块自适应重检索的知识检索增强方法与系统,获取知识文档和查询语句;利用后分块策略得到词向量分组,基于语义得到文本块;将查询语句输入嵌入模型得到查询向量;匹配查询向量对应的词向量所在分组,以此分组所在文本块作为召回文档;拼接提示词与召回文档输入预定大模型,输出回答结果;计算回答中分词置信度,若最大分词置信度低于置信度阈值,标记该分词为关键词并进行关键词掩码处理;利用改进Colbert相似度算法加权计算总相似度;在召回文档中进行相似度检索,根据重检索结果生成回答结果;直至回答结果的置信度均高于预设的置信度阈值,获得最终的回答结果;本发明优化检索方法,提升生成回答的完整性与正确率。
技术关键词
关键词
置信度阈值
分块策略
文本
索引
语句
标记
数据获取模块
输出模块
语义
分词技术
检索方法
处理器
算法
符号
正确率
系统为您推荐了相关专利信息
状态机
加速系统
里程计
点云局部
线性反馈移位寄存器
正态分布模型
模型库
数据分析方法
样本
三维可视化平台
家具榫卯结构
智能构建方法
图像智能识别技术
多模态数据融合
图谱