摘要
本发明公开了一种基于视觉状态空间的表格结构识别方法及系统,所述方法包括:获取表格图像数据;构建表格结构识别模型,所述模型包括图像分割模块、线性模块、视觉状态空间模块、稀疏专家模块、图像文本融合模块、激活函数ReLU、Mamba模块以及序列预测模块;将获取的表格图像数据输入所述表格结构识别模型,识别得到表格图像数据对应的结构化标记序列。本发明提供的方法及系统,能在保持长距离依赖构建能力的前提下减少计算资源消耗,实现对表格结构的精确识别。
技术关键词
表格
结构识别方法
线性模块
空间模块
图像分割
文本
融合视觉特征
局部视觉特征
序列特征
标签
标记
样本
生成训练数据
系统为您推荐了相关专利信息
三维超声
超声图像数据
相控阵
三维成像方法
造影剂
身份识别装置
录入装置
后台管理装置
计算机可读指令
对象
建筑物提取方法
输出特征
分支
深度学习模型
阶段
遥感图像分割方法
农田
遥感图像特征
全局特征提取
边缘轮廓
超声数据
图像数据管理设备
超声检测设备
图像数据管理方法
存储模块