一种基于PaddleOCR的复杂背景图像文字检测与增强系统及方法

AITNT
正文
推荐专利
一种基于PaddleOCR的复杂背景图像文字检测与增强系统及方法
申请号:CN202411715465
申请日期:2024-11-27
公开号:CN119625743A
公开日期:2025-03-14
类型:发明专利
摘要
本发明涉及图像文字处理技术领域,尤其涉及一种基于PaddleOCR的复杂背景图像文字检测与增强系统及方法,包括:通过批量读取指定目录下的图像文件,利用PaddleOCR模型进行初步文字检测与识别,提取文字边界框及其对应的文字内容,并计算每个文字的中心位置。基于初步识别结果,系统进一步分析字符特征,包括平均字符宽度、平均字符高度及字符间距,以推测图像中可能存在但未被初步识别的文字区域位置。对于预测的潜在文字区域,系统进行图像增强处理,对比度增强和直方图均衡化,并再次应用OCR模型进行文字识别,持续补充新的识别结果。本发明显著提升了OCR的识别率和处理效果,适用于复杂背景、商品包装、食品检测机构成分识别等。
技术关键词
对比度 图像文字处理技术 直方图均衡化 图像增强 颜色 平均字符宽度 生成感兴趣区域 食品检测机构 文字识别算法 识别模块 OCR系统 间距 层级 聚类技术 目录 商品包装
系统为您推荐了相关专利信息
1
芯片仿真缺陷生成方法、装置、计算机设备及存储介质
解码器 芯片 图像 风格 编码器
2
基于组分分析的水稻地上生物量反演方法、装置、介质及设备
纹理特征 反演模型 反演方法 数字表面模型 多光谱
3
用于环境光下的投影幕布光场显示增益方法及系统
增益方法 投影幕布 遗传算法优化 闭环反馈机制 投影设备
4
基于图像融合的带式输送机故障诊断方法
托辊支撑座 标签特征 带式输送机 可见光图像 故障诊断方法
5
一种基于U型脉冲网络的图像曝光矫正方法
矫正方法 脉冲 噪声图像 采样模块 网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号