一种文档信息抽取方法、装置和系统及存储介质

正文

推荐专利

申请号：CN202411872348

申请日期：2024-12-18

公开号：CN119942576A

公开日期：2025-05-06

类型：发明专利

摘要

本发明公开了一种文档信息抽取方法、装置和系统及存储介质，涉及深度学习领域，包括：输入原始文档进行预处理，得到文档图像；采用Vision Transformer(ViT)对文档图像进行OCR识别，得到文本信息和与文本信息对应的文本框坐标信息；基于深度学习的yolov8‑seg实例分割算法，确定每个版面元素框的类别和坐标信息，再将版面元素框坐标信息与文本框坐标信息进行版面区域匹配，得到每个版面元素框对应的文本信息；将每个版面元素框的类别和对应的文本信息作为版面区域匹配结果，结合待抽取的文档信息形成Prompt模板，作为大模型的输入并进行微调训练，微调训练完成后，模型可根据输入正确抽取文档信息。该方法结合了OCR的文字识别、版面分析的布局解析和大模型的语言理解能力，能够从复杂多样的文档中精准提取关键信息。

技术关键词

信息抽取方法实例分割算法坐标元素字段模板信息抽取系统图像缩放抽取装置倾斜文本表格模糊算法数据冗余实体彩色图像图表分析单元处理器

系统为您推荐了相关专利信息

一种基于CATIA快速骨架建模方法

建模方法节点连线参数骨架模型

一种基于大模型的痤疮分级模型迁移方法

模型迁移方法痤疮特征提取器文本编码器分类准确率

一种管束最终冲洗工作站设备视觉定位系统

视觉定位系统工作站设备齿轮齿条组件六轴机器人管件端面

基于视频分析的输电导线舞动监测方法

视频录入设备输电导线视频分析监测方法杆塔连接处

一种基于跨模态知识迁移的毫米波人体网格重建方法

人体模型人体形状参数网格重建方法深度图三维位置信息

一种文档信息抽取方法、装置和系统及存储介质

站点导航

APP 下载