摘要
本申请公开一种文档文件的表格识别方法及相关装置,涉及计算机应用与人工智能领域,所述方法包括:将待处理文档文件的页面转换成第一图像;对第一图像进行图像增强得到第二图像;利用目标智能体对第二图像进行表格检测,得到表格区域位置信息;目标智能体包括基于双支路模型调优构建的表格检测模型,目标智能体的第一支路用于学习与提取表格的结构性特征,第二支路用于学习与提取表格的文本语义特征;识别所述表格区域位置信息所指示表格区域中的表格数据,并将表格数据转换为结构化形式进行输出。本申请通过在表格识别中结合使用图像增强处理和基于深度学习的双支路模型调优等技术,可实现对文档文件进行高精度、高效率、高适应性的表格识别。
技术关键词
深度学习模型
表格识别方法
二值化图像
区域位置信息
语义特征
颜色
卷积神经网络提取
文本
轮廓信息
图像转换模块
像素
图像增强模块
对比度
样本
校正
数据
支路
系统为您推荐了相关专利信息
预测管理方法
深度学习网络
人流量数据
构建卷积神经网络
时间序列形式
图像识别方法
文本特征向量
图像特征向量
节点
眼科
智能识别方法
CRF模型
测井
LSTM模型
训练集数据
水下无线光通信
监督深度学习
编解码方法
解码模型
发射单元