摘要
本发明公开了一种基于混合方法的文档布局分析方法,对每一块文本节点进行命名体识别和关系提取属于数字图像处理技术领域。本发明提出一个新颖的通道洗牌的动态范围卷积算法,确保全局的通道特征可以学习到相似像素而非临近像素的特征,并使用适配器以较少的参数量学习文本特征。最终以预测的文本块类别和关系作为结果。最后本发明使用具有挑战性的文档数据集作为验证指标(FUNSD),结果表明提出的方法可以取得明显的性能提升。
技术关键词
文本
布局分析方法
混合方法
通道
适配器
图像视觉特征
阶段
洗牌
关系
多尺度
批量数据
Sigmoid函数
数字图像处理技术
卷积神经网络提取
节点特征
交叉注意力机制
命名体识别
系统为您推荐了相关专利信息
表面缺陷检测方法
轴承端盖
表面缺陷图像
表面缺陷检测系统
对象轮廓
随机森林模型
智能识别方法
高维特征向量
灰度共生矩阵
直方图
光谱采集系统
光学传感器
FIFO模块
驱动控制模块
接口模块