摘要
本发明公开了一种基于目标检测和关键点检测的证件版面分析方法,包括:步骤A:采集到彩色的证件图像,并对证件图像进行标签标注;步骤B:提取彩色的证件图像的特征信息,对证件图像获得编码特征;步骤C:在损失函数中加入坐标宽度损失函数,对图像特征和相对应的标签信息进行损失计算;步骤D:通过目标检测和关键点检测算法,对证件图像进行结果预测,包括标题坐标和内容坐标,以及内容坐标所对应的关键点信息的坐标,进行结果预测,得到内容栏所在的文本行框和标题栏的文本行框,以及内容栏所对应的关键点位置;步骤E:使用字符识别算法进行全页文本行识别,根据步骤D获得标题栏与对应内容栏的关系,结构化输出全页识别信息。
技术关键词
版面分析方法
证件图像
字符识别算法
坐标
关键点检测算法
标签
文本行
代表
编码特征
索引
网络结构
关系
数值
系统为您推荐了相关专利信息
坐标系
信息采集模块
图像采集模块
注视点
智能眼镜
滑模控制方法
径向基函数神经网络
横向相对速度分量
二阶滑模
转向控制器
轻量级深度学习
数据处理方法
地理坐标信息
云端
模型剪枝