摘要
本申请涉及一种公式识别方法和装置,所述方法包括:获取待识别图像;对所述待识别图像进行处理得到所述待识别图像的嵌入向量序列,所述嵌入向量序列包括所述待识别图像分割而成的多个图像块的嵌入向量;根据所述嵌入向量序列提取所述待识别图像在多个不同尺度下的特征图;根据所述待识别图像在多个不同尺度下的特征图,确定所述待识别图像中的公式文本字符。由此可以实现有效地提取提取待识别图像在不同尺度下的关键特征,确保模型在不同尺度上都能捕获到有用的信息,进而有助于获取完整、准确的公式文本字符识别结果。
技术关键词
解码网络
特征提取模块
公式识别方法
多层次
解码模块
融合特征
文本
序列
特征提取网络
图像分割
字符识别
注意力
多尺度特征提取
采样模块
图像获取模块
识别装置
系统为您推荐了相关专利信息
动态调控方法
变换特征
多通道
支持向量机模型
矩阵
工程地质区划
控制策略
无监督聚类
工程系统
数据
甲状腺乳头状癌
转移预测方法
多模态
分类器
待测对象
跨步电压
捕捉算法
在线监测方法
多层次
在线监测系统
自动编码器
入侵检测方法
多头注意力机制
模态分解方法
Softmax函数