文档处理方法、装置、设备及存储介质

AITNT
正文
推荐专利
文档处理方法、装置、设备及存储介质
申请号:CN202510922804
申请日期:2025-07-04
公开号:CN120823612A
公开日期:2025-10-21
类型:发明专利
摘要
本申请公开了一种文档处理方法、装置、设备及存储介质,涉及数据处理技术领域,公开的文档处理方法包括:获取待处理文档,并识别待处理文档中的文本区域以及图像区域;对文本区域进行文本提取,得到矢量文本内容;通过多个光学字符识别模型对图像区域进行字符识别并获取识别结果;在识别结果中根据各光学字符识别模型对应的字符识别结果确定置信度权重;根据各置信度权重将各字符识别结果与矢量文本内容进行融合,得到融合后文本内容;根据融合后文本内容输出结构化数据或半结构化数据,从而能够兼容混合类型的文档输入,实现对包含文本区域和图像区域的混合类型文档的处理,有效满足了用户需求。
技术关键词
树状结构模型 文本 光学字符识别 层次结构信息 排版信息 图像 数据输出模块 数据处理技术 表达式 字体 处理器 表格 输入模块 层级 可读存储介质 嵌套
系统为您推荐了相关专利信息
1
基于环境声音特征的真实性分析方法、装置、设备及介质
输入分析模型 分析方法 数据 生物声学 文本
2
一种数字化智能施工管理方法及系统
施工管理方法 施工平台 施工现场数据 资料 生成会议记录
3
图像编码模型训练方法、装置、计算机设备和存储介质
图像编码 模型训练方法 样本 学习方法 数据
4
文本预测方法及装置、电子设备、存储介质及程序产品
文本预测方法 大语言模型 非临时性计算机可读存储介质 电子设备 存储计算机程序
5
既可分区又可全屏操作的虚拟折叠白板研判工具
折叠白板 分区 实体 排版 资源
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号