一种文档信息抽取方法、装置、设备及其存储介质

AITNT
正文
推荐专利
一种文档信息抽取方法、装置、设备及其存储介质
申请号:CN202411114130
申请日期:2024-08-14
公开号:CN118627501B
公开日期:2024-10-29
类型:发明专利
摘要
本申请属于信息提取技术领域,涉及一种文档信息抽取方法、装置、设备及其存储介质,包括对目标文档进行节点信息抽取和文档结构解析;对所有节点信息进行序列化处理;对目标序列进行特征提取;根据所有节点信息的特征向量表示,构建图节点表示;将所有图节点表示输入到预设的文档图重建模型,进行文档图重构;将重构文档图输入到预设解码模型,进行解码,完成对目标文档中文档信息的抽取。采用对目标文档先编码、由文档节点构建图节点,之后再解码获得文档信息的方式,实质上采用了自监督学习方式进行文档信息抽取,无需标注,节省了标注消耗,同时,节省了大量算力资源,实现了快速准确且自动化的对文档信息进行抽取。
技术关键词
信息抽取方法 解码模型 计算机可读指令 坐标系 抽取装置 序列 识别策略 信息提取技术 节点特征 编码 可读存储介质 特征提取模块 重构模块 网络架构 处理器 计算机设备
系统为您推荐了相关专利信息
1
一种六自由度视觉抓取系统的机械臂及其自标定方法
末端执行器 旋转轴 抓取系统 伸缩轴 标定方法
2
车联网入侵行为检测与防御方法、装置、设备及介质
基线 车联网云平台 网络通信数据 车辆 环境感知数据
3
基于APF带电作业机器人避障路径规划方法、设备及介质
避障路径规划方法 带电作业机器人 机械臂连杆 碰撞检测模型 障碍物
4
基于差分进化的改进Mahony互补滤波无人机姿态结算方法
无人机姿态 结算方法 陀螺仪数据 导航坐标系 磁力计
5
多源点云数据的融合方法、终端设备和存储介质
三维网格模型 融合方法 融合点云数据 三维扫描装置 纹理
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号