一种基于计数模块的手写数学公式多尺度识别方法

AITNT
正文
推荐专利
一种基于计数模块的手写数学公式多尺度识别方法
申请号:CN202411455744
申请日期:2024-10-18
公开号:CN118968528B
公开日期:2025-01-28
类型:发明专利
摘要
一种基于计数模块的手写数学公式多尺度识别方法,涉及图像识别技术领域,解决现有技术针对手写体数字识别模型存在的识别准确性低的问题,本方法通过构建手写数学公式图像数据集,将手写数学公式图像输入构建基于计数模块的手写数学公式识别模型,采用ResNet对处理后的图像数据集中手写数学公式图像提取特征图,采用符号计数模块对特征图添加全局信息,通过LSTM输出预测的LaTeX序列。本方法将手写数学公式识别建模为一个图像至序列的任务。利用编码器被用于提取输入图像的特征,而解码器则逐步预测对应LaTeX序列。本方法有效地将手写数学公式识别问题转化为一个端到端的序列生成问题,简化了问题的复杂性。
技术关键词
多尺度识别方法 符号特征 手写数学公式识别 ResNet网络 图像提取特征 模块 手写体数字识别 序列 编码器 注意力 输入解码器 图像识别技术 通道 数据 元素
系统为您推荐了相关专利信息
1
一种动态多目标跟踪与轨迹预测方法
轨迹预测方法 深度特征集合 双流神经网络 视觉特征 估计运动参数
2
多模态数据融合的水电机组参数智能优化方法及其系统
水电机组 参数智能优化方法 多模态数据融合 ResNet网络 模态特征
3
一种基于图像处理的传感器硬件木马检测方法和系统
硬件木马检测方法 传感器电路 训练样本集 感兴趣区域图像 图像处理
4
基于3D高斯溅射模型的口腔三维模型重建方法及表达率分析系统
三维模型重建方法 点云信息 球体 分析系统 场景
5
一种基于轻量级分割残差网络的复杂农田视觉导航方法及系统
视觉导航方法 残差网络 田间环境 判定算法 ResNet网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号