摘要
本发明涉及基于注意力修正的图神经网络的视觉文档信息抽取方法,包括先依据实体及其文本内容与文本框信息提取实体节点图像、文本、布局特征,获取文档中各实体节点相邻最近的n个实体节点索引以生成边邻接矩阵,后将实体节点特征与边邻接矩阵输入GraphSAGE图网络模型学习节点特征,此过程融合图卷积与基于结构特征的注意力修正机制,依据节点特征距离与度信息计算并修正边权重,经多层图卷积与修正操作后输出特征表示,输入全连接层完成节点分类,对文档采样获取实体节点对及边特征,融合后再输入全连接层进行边分类。该方法借助GraphSAGE模型,有效融合多模态信息,精准捕捉节点与图结构特性,动态调整节点关系与权重,显著提升实体节点分类准确率。
技术关键词
实体
节点特征
信息抽取方法
注意力
布局特征
表达式
文本
邻居
视觉
模态特征
坐标
融合多模态信息
原始文档图像
关系
节点度信息
索引
定义
线性
系统为您推荐了相关专利信息
固化土强度
环境监测数据
流态固化土
参数
双向长短期记忆网络
资源分配方法
任务调度
注意力机制
终端设备
聚类算法
项目管理方法
节点
项目管理系统
项目管理模块
知识图谱构建