摘要
本发明涉及一种基于骨架塑形与字符计数模块的手写数学表达式识别方法,属于深度学习、图像内容识别技术领域。首先,构建编码器‑解码器模型的架构,采用DenseNet作为从图像中提取特征的编码器,采用Transformer作为解码器,通过自注意力机制来捕捉输入序列中的依赖关系。其次,提出一个骨架塑形与字符计数的模块,该模块通过字符频数分布预测模块来预测字符数量信息,通过骨架塑形器来提取表达式结构信息。然后,在结构校准模块中整合结构信息与解码后的特征,使得模型能够根据结构字符位置来确定序列中子结构的空间关系。最后,在数量校准模块中,模型可以利用已知的字符数量来推断最有可能的字符组合,并输出最终预测结果。
技术关键词
表达式
字符
识别方法
解码器模型
数学
编码器
矫正
模块
Softmax函数
序列
符号
图像内容识别
通道注意力机制
解码器架构
整合结构
多层感知机
系统为您推荐了相关专利信息
属性识别方法
多头注意力机制
空间位置关系
语义
服装
身体成分测量方法
测量点
独立成分分析
校准
电极系统