基于版面分析和多模态的信息抽取系统及方法

AITNT
正文
推荐专利
基于版面分析和多模态的信息抽取系统及方法
申请号:CN202411948232
申请日期:2024-12-27
公开号:CN119377388A
公开日期:2025-01-28
类型:发明专利
摘要
本发明属于信息抽取技术领域,具体涉及基于版面分析和多模态的信息抽取系统及方法。系统包括:文档解析模块,用于从各种格式的文档中提取关键信息;查询分析模块,用于深入分析和理解用户的查询请求;检索增强模块,用于通过结合大语言模型LLM与信息检索系统,从知识库中检索与用户查询请求最相关的信息,并将信息整合为提示词模板;重排过滤模块,用于将检索增强模块输出的提示词模板进行重新排序和过滤,获得最终的内容片段;文档抽取模块,用于获取最终的内容片段,与用户的查询请求一起格式化,并输入给大语言模型LLM,最后得到答案结果。本发明具有泛化能力更强,使用成本更低,且能够提高信息提取的准确性和效率的特点。
技术关键词
信息抽取系统 大语言模型 过滤模块 文本 信息抽取方法 信息检索系统 布局结构 分析模块 信息抽取技术 关键词 意图 格式化 模板 实体 答案 语义 多模态 切块
系统为您推荐了相关专利信息
1
一种基于多类型文档的抽取与检索方法
检索方法 文本 实体识别技术 金融 文档检索技术
2
基于多模态扩散模型的视觉诱发脑信号解码方法及系统
信号解码方法 视觉诱发脑 语义特征 多模态 重建高分辨率图像
3
样本集构建方法、问答模型的训练方法、问答处理方法、请求处理方法、任务平台
问答模型 样本集构建方法 图像 校验信息 场景
4
一种高压断路器故障诊断方法、系统、介质和设备
小波变换处理 高压断路器 连续小波变换 故障诊断技术 松动故障
5
文本水印检测和水印添加方法、程序产品、设备及介质
大语言模型 文本 计算机程序指令 同态加密算法 水印检测方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号