一种文档文件的表格识别方法及相关装置

AITNT
正文
推荐专利
一种文档文件的表格识别方法及相关装置
申请号:CN202510016587
申请日期:2025-01-06
公开号:CN119445601B
公开日期:2025-04-25
类型:发明专利
摘要
本申请公开一种文档文件的表格识别方法及相关装置,涉及计算机应用与人工智能领域,所述方法包括:将待处理文档文件的页面转换成第一图像;对第一图像进行图像增强得到第二图像;利用目标智能体对第二图像进行表格检测,得到表格区域位置信息;目标智能体包括基于双支路模型调优构建的表格检测模型,目标智能体的第一支路用于学习与提取表格的结构性特征,第二支路用于学习与提取表格的文本语义特征;识别所述表格区域位置信息所指示表格区域中的表格数据,并将表格数据转换为结构化形式进行输出。本申请通过在表格识别中结合使用图像增强处理和基于深度学习的双支路模型调优等技术,可实现对文档文件进行高精度、高效率、高适应性的表格识别。
技术关键词
深度学习模型 表格识别方法 二值化图像 区域位置信息 语义特征 颜色 卷积神经网络提取 文本 轮廓信息 图像转换模块 像素 图像增强模块 对比度 样本 校正 数据 支路
系统为您推荐了相关专利信息
1
一种基于深度学习网络的景区游客预测管理方法
预测管理方法 深度学习网络 人流量数据 构建卷积神经网络 时间序列形式
2
基于双流EfficientNet和决策树的眼科疾病图像识别方法
图像识别方法 文本特征向量 图像特征向量 节点 眼科
3
一种基于测井数据的地层岩性智能识别方法
智能识别方法 CRF模型 测井 LSTM模型 训练集数据
4
一种大数据文本检索挖掘系统及方法
文本 挖掘系统 图谱 层次聚类算法 检索策略
5
基于有监督深度学习的水下无线光通信编解码方法及系统
水下无线光通信 监督深度学习 编解码方法 解码模型 发射单元
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号