一种文档信息提取方法及设备

正文

推荐专利

一种文档信息提取方法及设备

申请号：CN202411925007

申请日期：2024-12-25

公开号：CN119851290A

公开日期：2025-04-18

类型：发明专利

摘要

本申请提出了一种创新的解决方案，在原有OCR文本框检测、文字识别提取的二阶方法之上，扩展图片文档分版面内信息的关系逻辑识别提取的高阶处理能力，能够充分利用文档的视觉特征和语义特征，在较少样本的情况下训练出效果很好的模型，且具备较强的泛化能力，从而快速满足企业中复杂版面文档信息抽取的需求。

技术关键词

文本文档结构化信息排版信息提取方法图像语义分割表格切片样本语义特征线框编码器参数视觉特征算法线条计算机设备关系存储器滤波处理器

系统为您推荐了相关专利信息

运维信息反馈方法语音输入信息多模态信息检索

防治系统多模态模型压缩表达式风险预测模型

文本实体地名识别方法语义编码器

法律文书生成方法语句三元组生成法律文书指数

图像信息抽取方法大语言模型文本行坐标位置信息答案