一种文档文件的表格识别方法及相关装置

正文

推荐专利

一种文档文件的表格识别方法及相关装置

申请号：CN202510016587

申请日期：2025-01-06

公开号：CN119445601B

公开日期：2025-04-25

类型：发明专利

摘要

本申请公开一种文档文件的表格识别方法及相关装置，涉及计算机应用与人工智能领域，所述方法包括：将待处理文档文件的页面转换成第一图像；对第一图像进行图像增强得到第二图像；利用目标智能体对第二图像进行表格检测，得到表格区域位置信息；目标智能体包括基于双支路模型调优构建的表格检测模型，目标智能体的第一支路用于学习与提取表格的结构性特征，第二支路用于学习与提取表格的文本语义特征；识别所述表格区域位置信息所指示表格区域中的表格数据，并将表格数据转换为结构化形式进行输出。本申请通过在表格识别中结合使用图像增强处理和基于深度学习的双支路模型调优等技术，可实现对文档文件进行高精度、高效率、高适应性的表格识别。

技术关键词

深度学习模型表格识别方法二值化图像区域位置信息语义特征颜色卷积神经网络提取文本轮廓信息图像转换模块像素图像增强模块对比度样本校正数据支路

系统为您推荐了相关专利信息

一种基于深度学习网络的景区游客预测管理方法

预测管理方法深度学习网络人流量数据构建卷积神经网络时间序列形式

基于双流EfficientNet和决策树的眼科疾病图像识别方法

图像识别方法文本特征向量图像特征向量节点眼科

一种基于测井数据的地层岩性智能识别方法

智能识别方法 CRF模型测井 LSTM模型训练集数据

一种大数据文本检索挖掘系统及方法

文本挖掘系统图谱层次聚类算法检索策略

基于有监督深度学习的水下无线光通信编解码方法及系统

水下无线光通信监督深度学习编解码方法解码模型发射单元

一种文档文件的表格识别方法及相关装置

站点导航

APP 下载