摘要
本发明公开了一种基于上下文感知的检索增强生成方法及系统,涉及信息检索技术领域,方法包括:对知识库文档进行分块处理,并分配唯一标识符及排序序号,建立文本块之间的关联关系以保存文档结构;构建文档的结构索引;根据用户的查询请求,基于向量相似度对查询内容进行初始检索,获得相关度最高的初始相关文本块集合;对初始相关文本块集合进行上下文扩展检索,获得扩展的前后文文本块集合;对前后文文本块集合进行去重、合并和重新排序处理,采用平滑过渡技术得到自然文本作为检索结果。通过本发明的技术方案,既保证相关性又保证上下文完整性,能够有效解决传统RAG系统的语义碎片化问题,显著提高了检索质量。
技术关键词
文本
生成方法
过渡技术
标识符
语义实体
索引系统
查询意图
分块
关系
生成系统
信息检索技术
自然语言
信息熵
关键词
模块
同义词
概念
逻辑
系统为您推荐了相关专利信息
结构生成方法
顶点
孔洞
约束Delaunay三角剖分
索引
大语言模型
识别人脸图像
人脸活体检测方法
视觉特征
多模态