一种文档识别方法、装置、计算设备和存储介质

正文

推荐专利

申请号：CN202510004821

申请日期：2025-01-02

公开号：CN119810855A

公开日期：2025-04-11

类型：发明专利

摘要

本申请提供一种文档识别方法、装置、计算设备和存储介质，包括：将待识别文档输入至光学字符识别OCR引擎，得到OCR引擎输出的第一识别结果；将待识别文档以及不同类数据的识别提示词分别输入至多个不同的多模态大语言模型，得到多个不同的多模态大语言模型输出的多个第二识别结果；针对文本类数据，将第一识别结果和多个第二识别结果进行对齐，得到第一输出结果；针对图类数据，基于多个第二识别结果，得到第二输出结果；基于第一输出结果和第二输出结果，得到待识别文档的识别结果。该方案，能够实现准确有效地对文档进行OCR识别。

技术关键词

大语言模型光学字符识别文档识别方法位置指示信息键值计算机可读指令文档识别装置分块数据计算机设备文本存储程序指令计算机程序产品可读存储介质存储器像素处理器

一种文档识别方法、装置、计算设备和存储介质

站点导航

APP 下载