摘要
本申请公开了一种内容识别方法、装置、电子设备及可读存储介质,涉及图像识别技术领域,包括:获取待识别图像,其中,所述待识别图像包括表格;对所述待识别图像进行表格结构识别,得到第一信息,其中,所述第一信息包括表格中每个区域框的标签信息以及每个区域框的第一位置信息;对所述待识别图像进行文本提取,得到第二信息,其中,所述第二信息包括表格中每个文本框的文本内容以及每个文本框的第二位置信息;基于所述第一位置信息以及所述第二位置信息,对所述区域框与所述文本框进行匹配,得到目标匹配对;基于所述目标匹配对中区域框的标签信息以及与该区域框匹配的文本框的文本内容,构建表格描述内容。提高了表格识别的适用性。
技术关键词
表格
内容识别方法
超文本标记语言
文本识别
标签
图像识别技术
重叠阈值
电子设备
可读存储介质
识别装置
处理器
对象
语义
存储器
计算机
程序
系统为您推荐了相关专利信息
情感分析模型
过滤方法
中文分词工具
BERT模型
词典
高频特征
融合特征
图像去噪方法
计算机执行指令
特征值