摘要
本发明涉及一种针对长文档的知识问答实现语义链检索增强生成处理的方法,主要包含知识库构建和用户知识问答两大部分。用户知识问答基于知识库构建,知识库构建涉及长文档的预处理、语义链式存储、信息压缩、知识提取和存储。用户在进行知识问答时,先经过细粒度语义编码成检索向量,再通过向量相似度计算去知识库中匹配出相关的文档向量和知识图谱。如果文档长度超过模型上下文规模,则通过信息压缩索引出静态信息压缩后的文档信息,再评估是否进行动态压缩,动态压缩返回与任务相关的文档片段。否则,直接返回相关原始文档作为生成器的背景知识。模型生成器再基于相关文档信息/信息压缩后的信息、知识图谱信息、用户问题和模型prompt生成答案。
技术关键词
语义
计算机可执行指令
命名实体识别技术
生成指令
知识图谱库
自然语言
处理器
三元组
生成答案
编码
序列
组织
动态
索引
可读存储介质
规模
关系
模板
系统为您推荐了相关专利信息
标签
脱敏规则
数据脱敏方法
数据脱敏系统
组合库
信号提取方法
信号识别模型
序列
应变传感器系统
非暂态计算机可读存储介质