一种基于多视角辅助的光学字符识别方法

正文

推荐专利

一种基于多视角辅助的光学字符识别方法

申请号：CN202510390687

申请日期：2025-03-31

公开号：CN120340039A

公开日期：2025-07-18

类型：发明专利

摘要

本发明公开了一种基于多视角辅助的光学字符识别方法，该方法利用激光雷达获取三维点云数据，经主成分分析降维、高程滤波去除背景点。投影点云到鸟瞰图，霍夫变换筛除噪音点，再用DBSCAN聚类算垂直字符线数量。之后先后粗、细重建字符线，生成完整三维点云用于字符识别。过程中可依点云密度动态调整霍夫变换和DBSCAN参数。还设有多视角融合验证步骤，若重建结果不符要求，返回调整粗重建参数。最终生成的三维字符线点云驱动基于深度学习的光学字符识别引擎，利用三维结构信息辅助字符分割与识别。该方法通过多视角融合、三维重建与智能参数优化，系统性解决了复杂环境下字符识别的难点，为文档扫描、自动驾驶等领域提供了高精度、高鲁棒性的解决方案。

技术关键词

光学字符识别方法多视角协方差矩阵 DBSCAN聚类算法三维点云数据点云密度邻域主成分分析算法坐标三维结构直线特征值激光雷达边缘检测算法参数

一种基于多视角辅助的光学字符识别方法

站点导航

APP 下载