摘要
本发明涉及技术领域,具体为一种基于深度学习的离线手写数学公式识别方法,包括数据采集处理、公式检测与符号分割、符号特征提取识别、结构分析重构以及评估优化。该基于深度学习的离线手写数学公式识别方法,通过采用分解重组提升模型对部分遮挡的鲁棒性,以局部畸变模拟真实手写形变,利用全局畸变增强泛化能力,根据CLAHE均衡化改善低对比度图像,减少光照影响,确保公式数据增强多样化处理,通过YOLOv5定位公式区域,根据U‑Net精准分割处理粘连符号并采用Transformer提取全局特征,通过调用Tesseract OCR并自定义符号库,将OCR与规则引擎结合能够提升特殊符号识别率,通过语法树与PCFG解析,递归下降生成语法树选择最优结构,并精准解析二维布局。
技术关键词
手写数学公式识别方法
DenseNet网络
离线
语义分割模型
卷积神经网络模块
低对比度图像
金字塔池化模块
嵌入位置编码
图像数据预处理
引入注意力机制
构建分类模型
图像提取特征
图像分割
分块
直方图均衡化
符号特征
系统为您推荐了相关专利信息
模拟退火优化算法
气候
通信信号参数
支持向量机回归模型
固定设备
保护系统
数据安全
FP‑Growth算法
计算机程序分析技术
度量