摘要
本申请涉及一种基于驾考表单的表格重建方法、系统及一体机装置。所述方法包括:采集多角度表单图像,使用标注工具生成标注图像,将标注图像转化为分割掩码图;将分割掩码图输入至SegFormer模型切分成预设尺寸的图像块序列,将图像块序列进行特征提取生成多尺度特征图,统一多尺度特征图的通道维度,预测分割掩码图;获取净化后的横竖线二值图,基于OpenCV提取闭合轮廓并按序排列生成轮廓列表以及对应的层级关系,递归搜索最内层轮廓并生成内边框轮廓集合,计算内框坐标,基于坐标分组确定行号和列号并生成对应的结构化数据。采用本方法能够通过形态学操作和轮廓分析,解决遮挡/模糊问题;SegFormer的序列压缩降低计算量;All‑MLP解码器替代复杂解码结构数据增强覆盖多种场景。
技术关键词
表格重建方法
生成多尺度
前馈神经网络
图像块
表单
多尺度特征
闭合轮廓
内边框
标注工具
序列
融合特征
坐标
内框
多角度
上采样
卷积神经网络模型
多级特征
解码结构
系统为您推荐了相关专利信息
供应链优化方法
分层强化学习
数字孪生模型
车辆
决策系统
面部皮肤图像
美容软糖
手机摄像头
色斑
特征提取模型