摘要
本发明公开了一种基于大语言模型的文档关键信息检索方法,根据多级输入的文档和用户输入的问题输出检索结果,该方法包括:构建领域知识图谱;构建并训练问题提取模型,通过问题提取模型得到用户输入的问题的关键信息和意图;根据关键信息和意图在知识图谱中检索,形成对关键信息的段落描述;对所述文档进行筛选并拆分成多个文本块,得到与用户输入的内容最相关的若干个文本块;使用大语言模型得出最高嵌入相似性的对应文本块;采用大语言模型整合推理对应文本块和段落描述,得到文档中的关于用户输入问题的信息。有益效果:不仅能够提高信息抽取的准确性和效率,还能够适应不同领域的特定需求,为文档自动化处理和知识管理提供强有力的技术支持。
技术关键词
大语言模型
信息检索方法
文本
三元组
图谱
标签标注方法
构建查询语句
信息抽取方法
文档自动化
条件随机场
意图类别
语义
实体
多标签
处理器
可读存储介质
关系
存储器
系统为您推荐了相关专利信息
智能推送系统
浏览网页信息
图像内容特征
广告媒体
数据特征提取
智能管理平台
动态知识图谱
多智能体深度强化学习
更新知识图谱
强化学习策略
大语言模型
知识图谱推理方法
桥梁
节点
知识图谱构建
有向传感器节点
水电站设备
数字孪生模型
故障特征
剩余使用寿命
人工智能技术
语义
上下文特征
事件驱动策略
预训练语言模型