摘要
本发明公开了一种基于多视角辅助的光学字符识别方法,该方法利用激光雷达获取三维点云数据,经主成分分析降维、高程滤波去除背景点。投影点云到鸟瞰图,霍夫变换筛除噪音点,再用DBSCAN聚类算垂直字符线数量。之后先后粗、细重建字符线,生成完整三维点云用于字符识别。过程中可依点云密度动态调整霍夫变换和DBSCAN参数。还设有多视角融合验证步骤,若重建结果不符要求,返回调整粗重建参数。最终生成的三维字符线点云驱动基于深度学习的光学字符识别引擎,利用三维结构信息辅助字符分割与识别。该方法通过多视角融合、三维重建与智能参数优化,系统性解决了复杂环境下字符识别的难点,为文档扫描、自动驾驶等领域提供了高精度、高鲁棒性的解决方案。
技术关键词
光学字符识别方法
多视角
协方差矩阵
DBSCAN聚类算法
三维点云数据
点云密度
邻域
主成分分析算法
坐标
三维结构
直线
特征值
激光雷达
边缘检测算法
参数