基于Tesseract-OCR的图像识别率提升方法和系统

正文

推荐专利

申请号：CN202510039367

申请日期：2025-01-10

公开号：CN119992571A

公开日期：2025-05-13

类型：发明专利

摘要

本发明提供了一种基于Tesseract‑OCR的图像识别率提升方法和系统。该方法的实现是基于Tesseract‑OCR对第一输入图像进行字符识别及提取，并通过对识别流程的优化以提升图像识别的准确性，具体是对训练数据集中待识别的第一输入图像执行预处理操作以及对训练数据集进行模型训练。图像预处理是提升OCR准确性的关键步骤之一，通过对第一输入图像进行一系列的预处理操作，可以优化图像质量，提高OCR引擎对文字区域的识别能力。通过上述过程的实现，可以对现有的Tesseract‑OCR图像识别流程进行优化，同时使用长短期记忆网络LSTM可以有效传递和表达长时间序列中的信息，使得长时间前的有用信息不被忽略，可以进一步提高图像识别的准确性。

技术关键词

命令行工具长短期记忆网络机器可读程序辅助工具 OCR图像识别页面校正模块提升系统测试模块数据模式对比度计算机字符识别字体格式

系统为您推荐了相关专利信息

一种大型钢结构连廊的焊缝质量的检测方法、介质及系统

大型钢结构焊缝特征提取网络特征融合网络频率响应

用于预测材料相变行为的方法

待测材料数据处理单元长短期记忆网络序列灰狼算法

一种光纤-结构体耦合协调度评价方法

度评价方法综合评价指数水工结构光纤监测系统评价指标体系

一种无线传输设备的信号优化方法及系统

无线传输设备信号优化方法轨迹预测模型动态步长调节稀疏压缩感知

一种页岩气水平井地质导向方法

页岩气水平井地质导向方法定向钻井工具深度强化学习长短期记忆网络策略

基于Tesseract-OCR的图像识别率提升方法和系统

站点导航

APP 下载