摘要
本发明提供了一种数学表达式识别模型构建、识别方法、装置和存储介质,涉及数据处理的技术领域,包括:获取公式数据集,对每个所述目标数学表达式进行分词,基于词元与索引值的映射关系构建词典,并设置编译规则,利用最大正向匹配算法基于所述词典和所述编译规则将所述目标数学表达式编译为索引值序列,生成至少一个第一目标LaTex标签,基于所述第一目标LaTex标签生成第一目标图像,将所述第一目标LaTex标签和所述第一目标图像输入至数学表达式识别模型中进行训练,通过本申请解决了现有技术中LaTeX标签序列无法表达一些特殊字符和字典膨胀的技术问题,减少了模型的计算量,相较于注意力机制的编码器-解码器,提升了模型的精度。
技术关键词
表达式
标签
数学
编译规则
构建词典
图像
索引
识别模型构建方法
识别方法
模型构建装置
序列
计算机
可读存储介质
编码
分词
注意力机制
处理器通信
字典
数据
系统为您推荐了相关专利信息
图像异常检测方法
多尺度局部特征
预训练网络
训练特征
柏林噪声
辅助评估系统
深静脉血栓
元素
指标
图像特征数据