基于Tesseract-OCR的图像识别率提升方法和系统

AITNT
正文
推荐专利
基于Tesseract-OCR的图像识别率提升方法和系统
申请号:CN202510039367
申请日期:2025-01-10
公开号:CN119992571A
公开日期:2025-05-13
类型:发明专利
摘要
本发明提供了一种基于Tesseract‑OCR的图像识别率提升方法和系统。该方法的实现是基于Tesseract‑OCR对第一输入图像进行字符识别及提取,并通过对识别流程的优化以提升图像识别的准确性,具体是对训练数据集中待识别的第一输入图像执行预处理操作以及对训练数据集进行模型训练。图像预处理是提升OCR准确性的关键步骤之一,通过对第一输入图像进行一系列的预处理操作,可以优化图像质量,提高OCR引擎对文字区域的识别能力。通过上述过程的实现,可以对现有的Tesseract‑OCR图像识别流程进行优化,同时使用长短期记忆网络LSTM可以有效传递和表达长时间序列中的信息,使得长时间前的有用信息不被忽略,可以进一步提高图像识别的准确性。
技术关键词
命令行工具 长短期记忆网络 机器可读程序 辅助工具 OCR图像识别 页面 校正模块 提升系统 测试模块 数据 模式 对比度 计算机 字符识别 字体 格式
系统为您推荐了相关专利信息
1
一种大型钢结构连廊的焊缝质量的检测方法、介质及系统
大型钢结构 焊缝 特征提取网络 特征融合网络 频率响应
2
用于预测材料相变行为的方法
待测材料 数据处理单元 长短期记忆网络 序列 灰狼算法
3
一种光纤-结构体耦合协调度评价方法
度评价方法 综合评价指数 水工结构 光纤监测系统 评价指标体系
4
一种无线传输设备的信号优化方法及系统
无线传输设备 信号优化方法 轨迹预测模型 动态步长调节 稀疏压缩感知
5
一种页岩气水平井地质导向方法
页岩气水平井地质导向方法 定向钻井工具 深度强化学习 长短期记忆网络 策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号