摘要
本发明属于信息抽取技术领域,具体涉及基于版面分析和多模态的信息抽取系统及方法。系统包括:文档解析模块,用于从各种格式的文档中提取关键信息;查询分析模块,用于深入分析和理解用户的查询请求;检索增强模块,用于通过结合大语言模型LLM与信息检索系统,从知识库中检索与用户查询请求最相关的信息,并将信息整合为提示词模板;重排过滤模块,用于将检索增强模块输出的提示词模板进行重新排序和过滤,获得最终的内容片段;文档抽取模块,用于获取最终的内容片段,与用户的查询请求一起格式化,并输入给大语言模型LLM,最后得到答案结果。本发明具有泛化能力更强,使用成本更低,且能够提高信息提取的准确性和效率的特点。
技术关键词
信息抽取系统
大语言模型
过滤模块
文本
信息抽取方法
信息检索系统
布局结构
分析模块
信息抽取技术
关键词
意图
格式化
模板
实体
答案
语义
多模态
切块
系统为您推荐了相关专利信息
信号解码方法
视觉诱发脑
语义特征
多模态
重建高分辨率图像
小波变换处理
高压断路器
连续小波变换
故障诊断技术
松动故障
大语言模型
文本
计算机程序指令
同态加密算法
水印检测方法