摘要
本申请提供一种数据提取方法、装置、电子设备及存储介质,涉及计算机技术领域。其包括以下步骤:获取待处理文档。确定待处理文档的格式是否为预设格式,预设格式为以下任一项:word文档、PDF文档、PPT文档、excel文档。若是,根据待处理文档的格式,确定数据提取方案,一种预设格式对应一种数据提取方案。基于数据提取方案,从待处理文档中提取有效数据。本发明能够对多种格式的文档采用定制化的数据提取方案,能够针对文档的结构特点分割文档,提高了数据提取时文档的分割效率。
技术关键词
数据提取方法
格式
电子设备
数据提取装置
光学字符识别
目录
可读存储介质
问答模型
大语言模型
模块
表头
摘要
处理器
指令
语义
存储器
计算机
图像
表格
系统为您推荐了相关专利信息
可编程交换机
VNF实例
网络切片编排方法
节点
深度优先搜索算法
数据标注方法
计算机可执行指令
文本
预训练语言模型
意图
数据传输方法
数据采集接口
云端服务平台
网络信号强度
终端单元