针对长文档的知识问答实现语义链检索增强生成处理的方法

AITNT
正文
推荐专利
针对长文档的知识问答实现语义链检索增强生成处理的方法
申请号:CN202511131698
申请日期:2025-08-13
公开号:CN121029966A
公开日期:2025-11-28
类型:发明专利
摘要
本发明涉及一种针对长文档的知识问答实现语义链检索增强生成处理的方法,主要包含知识库构建和用户知识问答两大部分。用户知识问答基于知识库构建,知识库构建涉及长文档的预处理、语义链式存储、信息压缩、知识提取和存储。用户在进行知识问答时,先经过细粒度语义编码成检索向量,再通过向量相似度计算去知识库中匹配出相关的文档向量和知识图谱。如果文档长度超过模型上下文规模,则通过信息压缩索引出静态信息压缩后的文档信息,再评估是否进行动态压缩,动态压缩返回与任务相关的文档片段。否则,直接返回相关原始文档作为生成器的背景知识。模型生成器再基于相关文档信息/信息压缩后的信息、知识图谱信息、用户问题和模型prompt生成答案。
技术关键词
语义 计算机可执行指令 命名实体识别技术 生成指令 知识图谱库 自然语言 处理器 三元组 生成答案 编码 序列 组织 动态 索引 可读存储介质 规模 关系 模板
系统为您推荐了相关专利信息
1
一种层次化精准识别的自动驾驶避障系统
语义分割网络 街景 标签 驾驶避障 图像处理模块
2
一种基于知识图谱与检索增强生成的心理健康辅助诊断方法
心理健康 辅助诊断方法 图谱 实体 大语言模型
3
设计稿描述文本的生成方法及装置
文本 训练样本集 基础 多模态 存储计算机程序
4
一种基于医疗数据的隐私数据脱敏方法系统及设备
标签 脱敏规则 数据脱敏方法 数据脱敏系统 组合库
5
过车信号提取方法及装置
信号提取方法 信号识别模型 序列 应变传感器系统 非暂态计算机可读存储介质
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号