摘要
本发明实施例提供一种跨页表格提取方法、装置及设备,涉及数据处理技术领域,其中,该方法包括:获取待处理文件,对待处理文件进行预处理,得到多个表格区域;对多个表格区域进行结构识别、特征提取并计算关联强度值,再根据每个待选跨页表格组中表格区域的关联强度值,将待选跨页表格组中的表格区域合并为目标格式的表格数据。本发明的方案使合并后的表格以目标格式输出,使其可直接用于与大模型交互。
技术关键词
表格提取方法
图像
页面高度
格式
强度
列表
数据处理技术
处理器
模块
存储器
坐标
标识
序列
电子设备
程序
指令
矫正
语义
系统为您推荐了相关专利信息
人工智能算法
策略标签
神经网络参数
前馈神经网络
页面
导线
数据存储模块
图像数据管理
识别模块
电力杆塔
人脸图像识别方法
采集人脸图像信息
判断人脸
人脸图像识别系统
结构光