OCR识别结果的校正方法、装置、设备以及计算机存储介质

正文

推荐专利

申请号：CN202510780596

申请日期：2025-06-12

公开号：CN120766090A

公开日期：2025-10-10

类型：发明专利

摘要

本申请公开了OCR识别结果的校正方法、装置、设备以及计算机存储介质。所述校正方法包括：获取OCR识别后的待校正文本，待校正文本包括：OCR识别错误导致的乱码字符、字符混淆错误或语法错误中的一种；构建语义校正指令模板，语义校正指令模板包括：任务定义、规则定义以及格式约束目标；将待校正文本与语义校正指令模板输入大语言模型，并通过大语言模型输出校正后的文本结果，大语言模型为预训练语言模型。本申请能够针对OCR识别错误导致的乱码字符、字符混淆错误或语法错误进行精准校正，有效提升文本的准确性及可用性，为后续文本处理提供高质量基础数据；本申请可以适应多种不同格式文档及多语言混合文本场景，节约维护成本，同时提高校正效率。

技术关键词

大语言模型校正方法训练语言模型语义字符定义校正装置段落结构模板计算机存储介质格式指令文本校正存储计算机程序校正设备字段纠错处理器

系统为您推荐了相关专利信息

图像分割方法、装置、计算机设备及计算机可读存储介质

语义分割模型物体图像分割方法计算机设备轻量型

车载问答方法、设备及介质

车辆控制指令问答方法大语言模型 FAQ问答预训练模型

一种区域级检索增强的多视角胸片报告生成方法

报告生成方法大语言模型序列特征影像生成指令

面向复杂环境的机器视觉导航优化方法

机器视觉导航兴趣语义自主导航技术高风险

一种数控机床刀具加工路径规划方法、系统、设备及介质

数控机床刀具路径规划方法预训练语言模型点云模型微调技术

OCR识别结果的校正方法、装置、设备以及计算机存储介质

站点导航

APP 下载