表格文档识别方法、装置、电子设备和存储介质

AITNT
正文
推荐专利
表格文档识别方法、装置、电子设备和存储介质
申请号:CN202411704009
申请日期:2024-11-26
公开号:CN120088804A
公开日期:2025-06-03
类型:发明专利
摘要
本发明提供一种表格文档识别方法、装置、电子设备和存储介质,其中方法包括:对待识别文档图像进行表格检测,得到表格图像;对表格图像进行表格线检测,得到横线段和竖线段;基于横线段和竖线段,确定表格单元格交点信息,并根据交点信息确定表格单元格结构信息;对待识别文档图像进行文本检测,得到检测结果;将检测结果中的各文本检测框与表格单元格结构信息中的各单元格进行匹配,得到各单元格对应的文本行区域,并对文本行区域进行文本识别,得到各单元格的文本识别结果。本发明通过对表格图像进行表格线检测,并根据检测得到横线段和竖线段,可以准确地确定表格单元格的交点信息和结构信息,提高了表格结构识别的准确率。
技术关键词
文档识别方法 表格 识别文档图像 文本识别模型 文本行 索引 文档识别装置 非暂态计算机可读存储介质 字典 坐标 线段 电子设备 处理器 解析单元 矩形 存储器 直线
系统为您推荐了相关专利信息
1
基于自训练范式模型的自然语言查询数据库方法及系统
自然语言 网络结构 生成数据库 训练集 矩阵
2
一种基于深度学习的自动化贷后管理方法及装置
贷后管理方法 表格 双向长短期记忆网络 深度学习模型 问答模型
3
一种基于html语义树的可控性表格重建模型的方法、装置及介质
表格 语义 文本处理技术 解码 序列
4
基于人工智能的文档处理方法、装置、设备及介质
元素 图片 多模态 标签 文本识别模型
5
一种基于图像驱动的产品知识图谱构建方法
产品知识图谱构建 关系 实体 图像 近邻传播聚类算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号