摘要
本发明公开了一种提取文本文档表格中单元格内容的方法、设备和存储介质,预设多组参数;基于Python win32com库调用文本文档应用软件提供的编程接口读取文本文档;将所述文本文档中的表格内容转换为一段连续的字符串,通过字符串匹配确定包含所述关键词的表格为目标表格;基于Python win32com库复制目标表格得到第一数据表,遍历所述第一数据表每个单元格,并使用二维数组存储第一数据表各单元格内容;基于二维数组,查找要提取的内容。本发明的优点在于利用文本文档应用软件自带的功能接口就能完成对文本文档内单元格内容的批量化提取,不需要使用OCR技术对文本文档进行转换和训练人工智能模型,具有很强的通用性,对表格的形式没有具体的要求,使用灵活,成本低。
技术关键词
关键词
表格
计算机程序指令
合并单元格
训练人工智能模型
参数
处理器
元素
编程
可读存储介质
接口
存储器
批量
数据
系统为您推荐了相关专利信息
变量
分布式服务器架构
字典
计算机程序指令
患者
一体化系统
模态特征
多模态
分布式管理
深度学习技术
10kV开关柜
辅助操作系统
教学模型
索引
分词
语义
知识检索系统
摘要提取模块
溯源信息
溯源方法