摘要
一种基于计数模块的手写数学公式多尺度识别方法,涉及图像识别技术领域,解决现有技术针对手写体数字识别模型存在的识别准确性低的问题,本方法通过构建手写数学公式图像数据集,将手写数学公式图像输入构建基于计数模块的手写数学公式识别模型,采用ResNet对处理后的图像数据集中手写数学公式图像提取特征图,采用符号计数模块对特征图添加全局信息,通过LSTM输出预测的LaTeX序列。本方法将手写数学公式识别建模为一个图像至序列的任务。利用编码器被用于提取输入图像的特征,而解码器则逐步预测对应LaTeX序列。本方法有效地将手写数学公式识别问题转化为一个端到端的序列生成问题,简化了问题的复杂性。
技术关键词
多尺度识别方法
符号特征
手写数学公式识别
ResNet网络
图像提取特征
模块
手写体数字识别
序列
编码器
注意力
输入解码器
图像识别技术
通道
数据
元素
系统为您推荐了相关专利信息
轨迹预测方法
深度特征集合
双流神经网络
视觉特征
估计运动参数
水电机组
参数智能优化方法
多模态数据融合
ResNet网络
模态特征
硬件木马检测方法
传感器电路
训练样本集
感兴趣区域图像
图像处理
视觉导航方法
残差网络
田间环境
判定算法
ResNet网络