一种基于大语言模型的文档关键信息抽取方法

正文

推荐专利

申请号：CN202411483004

申请日期：2024-10-23

公开号：CN119599107A

公开日期：2025-03-11

类型：发明专利

摘要

本发明公开了一种基于大语言模型的文档关键信息检索方法，根据多级输入的文档和用户输入的问题输出检索结果，该方法包括：构建领域知识图谱；构建并训练问题提取模型，通过问题提取模型得到用户输入的问题的关键信息和意图；根据关键信息和意图在知识图谱中检索，形成对关键信息的段落描述；对所述文档进行筛选并拆分成多个文本块，得到与用户输入的内容最相关的若干个文本块；使用大语言模型得出最高嵌入相似性的对应文本块；采用大语言模型整合推理对应文本块和段落描述，得到文档中的关于用户输入问题的信息。有益效果：不仅能够提高信息抽取的准确性和效率，还能够适应不同领域的特定需求，为文档自动化处理和知识管理提供强有力的技术支持。

技术关键词

大语言模型信息检索方法文本三元组图谱标签标注方法构建查询语句信息抽取方法文档自动化条件随机场意图类别语义实体多标签处理器可读存储介质关系存储器

系统为您推荐了相关专利信息

基于用户行为信息的广告媒体智能推送系统及方法

智能推送系统浏览网页信息图像内容特征广告媒体数据特征提取

一种大模型智能管理平台

智能管理平台动态知识图谱多智能体深度强化学习更新知识图谱强化学习策略

一种大模型辅助的桥梁知识图谱生成式构建方法

大语言模型知识图谱推理方法桥梁节点知识图谱构建

基于传感器网络的水电站安全管理方法及装置

有向传感器节点水电站设备数字孪生模型故障特征剩余使用寿命

一种基于人工智能技术的客服信息确定方法及装置

人工智能技术语义上下文特征事件驱动策略预训练语言模型

一种基于大语言模型的文档关键信息抽取方法

站点导航

APP 下载