摘要
本发明公开了一种基于大模型和RAG技术的知识构建方法及系统,属于大模型技术领域,本发明通过跨文本块互信息计算与RAG增强推理,系统能够量化实体间的统计相关性,并结合外部知识库的上下文信息,挖掘跨段落或文档的潜在关联关系,采用动态语义分割策略,确保文本块内部语义一致,并通过保留重叠部分维持上下文连续性,通过多维指代消解机制,综合判定同一实体的多表述,降低错误消解率,结合动态分割与混合检索,解决大模型输入长度限制问题,并通过语义检索与关键词匹配互补,提升召回率,本发明显著解决了传统知识构建中的语义断裂、跨文本关联缺失、实体对齐精度低等关键问题。
技术关键词
文本
实体
知识构建方法
检索策略
指代消解方法
混合搜索策略
语义
数据
词嵌入模型
字符
建立倒排索引
关系
模块
格式
关键词
可读存储介质
构建系统
对象
物理