一种基于覆盖注意力和位置感知的手写数学公式识别方法

AITNT
正文
推荐专利
一种基于覆盖注意力和位置感知的手写数学公式识别方法
申请号:CN202510396462
申请日期:2025-03-31
公开号:CN120318833A
公开日期:2025-07-15
类型:发明专利
摘要
本发明公开了一种基于覆盖注意力和位置感知的手写数学公式识别方法,包括:构建位置感知模块,通过弱监督学习生成字符位置图;构建多尺度覆盖注意力模块,优化Transformer解码架构中的注意力计算;将特征图与位置感知图融合,输入Transformer解码器生成LaTeX序列。本发明通过位置感知模块显式提取字符位置信息,增强模型对复杂数学结构的理解;多尺度覆盖注意力机制减少注意力漂移;采用计数标签的弱监督学习方式降低训练成本,提高模型性能。
技术关键词
多任务学习策略 表达式 多尺度特征提取 通道注意力机制 弱监督学习 特征提取能力 解码器架构 全局平均池化 解码架构 数学 符号特征 非线性 稳定特征 感知特征
系统为您推荐了相关专利信息
1
实现火星探测发射窗口任意时刻起飞诸元设计方法及系统
运载火箭 探测器 多项式 计算机可执行指令 参数
2
图像自动标注方法、系统、电子设备及存储介质
图像自动标注方法 多模态 语句 空间金字塔 通道注意力机制
3
一种混流式水轮机空蚀状态分析方法、系统、设备及介质
分数阶傅里叶变换 混流式水轮机 BiLSTM模型 状态分析方法 数据
4
一种基于多维数据融合的机场航班延误预测方法
航班延误预测方法 拥堵指数 三维卷积神经网络 长短期记忆网络 表达式
5
一种多智能体的变期望轨迹迭代一致性跟踪方法及系统
多智能体系统 迭代学习控制算法 跟踪方法 学习算法 拓扑图
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号