摘要
本申请提供了一种表格信息提取方法、装置、设备及存储介质,其中,该方法包括:基于预先训练得到的实体分类模型对待处理表格的单元格进行实体分类,得到待处理表格中各单元格的实体类型,实体分类模型基于待处理表格中各分词元素之间的位置关系得到单元格的实体类型,根据各单元格的实体类型,确定各单元格的关系信息,关系信息用于表征单元格与关联的单元格之间的包含关系,根据各单元格的关系信息对待处理表格进行信息提取,得到待处理表格的提取结果。本申请的方法可以适用于复杂多样的表格形式,具有很好的通用性,并且在降低实现复杂度的同时提升了表格信息提取的准确度。
技术关键词
实体分类模型
分词
表格信息提取方法
元素
表头
映射关系表
编码
序列
坐标
关键词
机器可读指令
信息提取装置
处理器
可读存储介质
文本
标识
列表
系统为您推荐了相关专利信息
布点方法
充电站
机制
蒙特卡洛模拟法
层次分析法
知识点标注方法
分词
生成知识图谱
标注系统
基础
选型方法
大语言模型
芯片
多轮对话
电路设计方法
网页数据采集方法
网页结构
强化学习策略
生成网页
计算机可读指令
高压配电室
识别方法
注意力
多层感知机
全局平均池化