一种多元文档解析方法及系统

AITNT
正文
推荐专利
一种多元文档解析方法及系统
申请号:CN202511385222
申请日期:2025-09-26
公开号:CN120874816A
公开日期:2025-10-31
类型:发明专利
摘要
本申请提供一种多元文档解析方法及系统,涉及计算机信息处理领域,解决了无法统一解析与集成各类型文档的格式,导致信息提取效率低、准确率不高的技术问题。该方法包括:识别待处理文档的类型;文档类型包括表格类、文本类和演示类;文本类包括Word格式和PDF格式;根据待处理文档的类型调用对应的解析函数,对待处理文档进行解析得到解析结果,解析结果包括提取的待处理文档的结构信息和内容数据;将解析结果转化为标准JSON格式并输出。本申请用于文档解析过程中。
技术关键词
文档解析方法 格式 YOLO模型 元素 图片 表格 工作表 文本 图像 媒体 合并单元格 识别页面 识别模块 索引 数据 解析系统 变量 语义标签 坐标
系统为您推荐了相关专利信息
1
一种共享数据处理系统及处理方法
数据处理系统 人力资源数据 集成层 数据存储 数据同步
2
一种基于BDVNN的信道化智能接收方法
低通滤波器 多相滤波器 信道化接收机 能量检测方法 信道化结构
3
一种基于风险探测模型的模板配置化金融报告生成方法
报告生成方法 模组 模板 风险 金融
4
一种基于物模型与规则引擎的大规模物联网数据处理方法
数据格式 物联网数据处理技术 Modbus通信协议 物联网异构设备 物理设备
5
音乐生成方法、装置、电子设备和存储介质
语义向量 音乐生成方法 音乐特征 文本 声学特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号