摘要
本申请属于信息提取技术领域,涉及一种文档信息抽取方法、装置、设备及其存储介质,包括对目标文档进行节点信息抽取和文档结构解析;对所有节点信息进行序列化处理;对目标序列进行特征提取;根据所有节点信息的特征向量表示,构建图节点表示;将所有图节点表示输入到预设的文档图重建模型,进行文档图重构;将重构文档图输入到预设解码模型,进行解码,完成对目标文档中文档信息的抽取。采用对目标文档先编码、由文档节点构建图节点,之后再解码获得文档信息的方式,实质上采用了自监督学习方式进行文档信息抽取,无需标注,节省了标注消耗,同时,节省了大量算力资源,实现了快速准确且自动化的对文档信息进行抽取。
技术关键词
信息抽取方法
解码模型
计算机可读指令
坐标系
抽取装置
序列
识别策略
信息提取技术
节点特征
编码
可读存储介质
特征提取模块
重构模块
网络架构
处理器
计算机设备
系统为您推荐了相关专利信息
基线
车联网云平台
网络通信数据
车辆
环境感知数据
避障路径规划方法
带电作业机器人
机械臂连杆
碰撞检测模型
障碍物
无人机姿态
结算方法
陀螺仪数据
导航坐标系
磁力计
三维网格模型
融合方法
融合点云数据
三维扫描装置
纹理