一种基于深度学习的表格文本检测与识别方法及系统

AITNT
正文
推荐专利
一种基于深度学习的表格文本检测与识别方法及系统
申请号:CN202410924916
申请日期:2024-07-11
公开号:CN118968533A
公开日期:2024-11-15
类型:发明专利
摘要
本发明公开一种基于深度学习的表格文本检测与识别方法及系统,涉及表格文本检测与识别技术领域,方法包括:基于深度学习框架,构建并优化单元格检测模型和文字识别模型;利用检测模型检测输入图像中的表格,提取表格中包含的所有单元格,并进行倾斜矫正;利用识别模型识别输入图像中的文本框及其文字信息;对单元格进行分簇处理,识别图片上的所有独立表格;应用Cell坐标聚合算法,将文本框与单元格匹配,获取单元格文本信息;使用密度聚类算法,将表格线合并为垂直线和水平线并排序,将水平线和垂直线的索引从0开始编号;按照行索引对单元格进行排序,并输出每个单元格的行和列信息。本发明可以提高表格文本检测识别的效率和准确性。
技术关键词
表格 密度聚类算法 索引数据结构 文本 识别方法 深度学习框架 坐标 识别系统 扫描线算法 深度优先遍历 索引方式 图像 排序算法 顶点 处理单元 识别模块 图片 列表
系统为您推荐了相关专利信息
1
基于VoNR+实现5G新通话业务的实时综合渲染系统
应用服务器 渲染系统 终端设备 子模块 视频流
2
基于知识图谱的煤炭行业大模型检索增强生成方法及系统
文本 意图识别 语句 图谱 标签
3
人形机器人故障分析方法及相关设备
故障分析模型 特征提取模型 历史故障数据 故障分析方法 文本
4
一种基于条件双分支扩散模型的人体姿态估计方法
人体姿态估计方法 关节特征 注意力 三维人体姿态估计 姿态特征
5
语音识别模型的训练方法、服务器和计算机可读存储介质
语音识别模型 关键词 数据 音频 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号