摘要
本申请提供了一种表格识别方法、装置、设备及存储介质,方法包括:基于仿射变换模型对原始表格图像进行倾斜校正得到校正后表格图像,对校正后表格图像进行文字检测,得到原始表格文本信息,基于语义重组模型对原始表格文本信息中的原始表格文本进行文本重组,得到多个重组后表格文本特征,将校正后表格图像和多个重组后表格文本特征输入目标检测模型中,得到校正后表格图像中各单元格的起止位置坐标和起止行列,根据各单元格的起止位置坐标和起止行列,识别得到表格信息。通过本申请能够提升表格倾斜校正的准确率及泛化性,并提升复杂单元格的识别准确率以及表格信息的准确率。
技术关键词
表格识别方法
文本
矩阵
校正
模型训练方法
坐标
图像特征向量
机器可读指令
语义
注意力
可读存储介质
处理器
编码
解码
电子设备
存储器
计算机
像素
系统为您推荐了相关专利信息
补全方法
数据平台
数据标准规范
文本段落
大语言模型
头部运动轨迹
座椅靠背角度
轨迹预测模型
矩阵
速度