摘要
本申请涉及一种基于人工智能的数学公式识别方法。所述方法包括:获取数学公式图像,并对数学公式图像进行预处理,生成待识别图像;将待识别图像输入至第一编码模型中,生成初步识别特征图集;将初步识别特征图集输入至第二编码模型中,生成注意力编码特征图;将注意力编码特征图输入至解码模型中进行特征解码,生成数学公式识别结果数据。采用本方法能够通过利用两层编码模型分别提取初步识别特征和注意力编码特征,再经解码模型生成识别结果,能够实现对数学公式图像的高效、准确识别,进而提升模型对复杂公式结构的理解能力,增强数学公式识别方法的泛化能力。
技术关键词
识别特征
数学公式识别方法
编码特征
检测组件
解码模型
YOLO模型
双向特征金字塔
字符
位置编码信息
数学公式识别装置
深度学习神经网络模型
协方差矩阵
网络结构
图像
层级
标签
注意力机制
系统为您推荐了相关专利信息
图像编码器
三维医学图像分割
视觉
编码特征
深度注意力机制