一种基于掩码机制的文本OCR和公式OCR快速融合方法

AITNT
正文
推荐专利
一种基于掩码机制的文本OCR和公式OCR快速融合方法
申请号:CN202510388494
申请日期:2025-03-31
公开号:CN120496088A
公开日期:2025-08-15
类型:发明专利
摘要
本发明公开了一种基于掩码机制的文本OCR和公式OCR快速融合方法,属于公式融合技术领域,其包括:S1、图像获取;S2、图像增强:对原始图像进行灰度化、二值化、去噪等预处理操作,以提高图像的清晰度和质量,便于后续的处理;S3、文本定位与掩码创建;S4、公式定位与掩码创建;S5、文本精确定位;S6、公式精确定位;S7、文本OCR处理;S8、公式OCR处理;S9、建立坐标映射关系;S10、融合处理;S11、格式调整;S12、错误校正:通过人工检查或自动校对算法。本发明通过文本和公式的初步定位与精确定位相结合,并借助掩码机制进行优化,能够实现文本和公式的高精度定位。这有效避免了错位和不匹配的问题,提高了融合的准确性。
技术关键词
融合方法 文本检测模型 符号特征 像素 坐标 机制 检查算法 关系 字体 错误校正 字符识别 文字处理软件 图像增强 文本行 格式 加权平均法
系统为您推荐了相关专利信息
1
一种PBR材质集选取策略的优化方法
环境光照强度 标签 参数 数据 策略
2
基于机器视觉的智能晾衣架自动控制方法及系统
智能晾衣架 自动控制方法 控制晾衣架 悬挂衣物 衣物主体
3
ATW延迟预测方法及装置、存储介质及电子设备
透明计算器 高精度定时器 硬件性能计数器 显示屏 透明度
4
一种基于方向约束密度聚类算法的车辆轨迹数据分析方法
车辆轨迹数据分析 密度聚类算法 坐标系 卡尔曼滤波 道路交通数据
5
矿山三维模型的构建方法、装置、电子设备及存储介质
实景三维模型 三维点云数据 矿山 扫描装置 坐标
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号