摘要
本发明公开了一种基于覆盖注意力和位置感知的手写数学公式识别方法,包括:构建位置感知模块,通过弱监督学习生成字符位置图;构建多尺度覆盖注意力模块,优化Transformer解码架构中的注意力计算;将特征图与位置感知图融合,输入Transformer解码器生成LaTeX序列。本发明通过位置感知模块显式提取字符位置信息,增强模型对复杂数学结构的理解;多尺度覆盖注意力机制减少注意力漂移;采用计数标签的弱监督学习方式降低训练成本,提高模型性能。
技术关键词
多任务学习策略
表达式
多尺度特征提取
通道注意力机制
弱监督学习
特征提取能力
解码器架构
全局平均池化
解码架构
数学
符号特征
非线性
稳定特征
感知特征
系统为您推荐了相关专利信息
图像自动标注方法
多模态
语句
空间金字塔
通道注意力机制
分数阶傅里叶变换
混流式水轮机
BiLSTM模型
状态分析方法
数据
航班延误预测方法
拥堵指数
三维卷积神经网络
长短期记忆网络
表达式
多智能体系统
迭代学习控制算法
跟踪方法
学习算法
拓扑图