基于多模态特征融合的手写数学公式动态识别方法

AITNT
正文
推荐专利
基于多模态特征融合的手写数学公式动态识别方法
申请号:CN202510578983
申请日期:2025-05-07
公开号:CN120088800B
公开日期:2025-09-09
类型:发明专利
摘要
本发明公开一种基于多模态特征融合的手写数学公式动态识别方法,包括:步骤1、采用HSV颜色模型对数据包含的笔画轨迹序列信息进行编码转换,生成HSV伪彩色图像,再将HSV伪彩色图像与数据二值图像融合得到时序丰富图像;步骤2、通过卷积神经网络,分别对时序丰富图像以及笔画轨迹序列进行特征提取,得到图像特征和笔画特征,并利用图像特征增强笔画特征,再将图像特征与增强后的笔画特征融合后得到多模态特征;步骤3、通过解码器,采用位置编码对输入的多模态特征进行增强,再结合注意力机制和多尺度符号计数模块进行符号预测,生成数学公式符号序列;步骤4、设计规则,对生成数学公式符号序列进行修正。本发明可提升易混淆字符识别的准确性。
技术关键词
动态识别方法 笔画特征 HSV颜色模型 符号 多模态特征融合 彩色图像 序列 注意力机制 解码器 时序 编码 轨迹 状态空间模型 伪彩图像 多尺度 饱和度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号