摘要
本发明属于图形识别技术领域,涉及一种多语言贸易自动化的低质量单据动态特征融合OCR方法,包括:S1、由嵌入ACmix模块的MobileNet_V1_Enhance骨干网络提取多尺度特征;S2、利用SVTR颈部网络轻量化自注意力模块编码和残差融合,强化语义建模;S3、由CTC解码器和SAR解码器双路径解码输出识别结果,CTC解码器用于解决标签对齐问题,SAR解码器用于增强相似字符区分能力,并通过总损失函数联合优化,实现精准识别;本发明在保证实时性的同时,增强了对小语种字符细微差异的捕捉能力,在英语、俄语及混合语言任务中的准确率均显著优于基线模型,为跨境贸易单证处理提供了更高效的解决方案。
技术关键词
多语言
解码器
单据
动态
网络
图形识别技术
局部纹理特征
注意力机制
多尺度特征提取
阶段
模块
语义
贸易单证
解码机制
字符
识别头
系统为您推荐了相关专利信息
BP神经网络模型
误差反向传播
光功率
预测误差
光伏阵列
神经网络预测模型
流媒体传输方法
链路状态信息
编码策略
皮尔逊相关系数
模数转换器
数据校准方法
误差模型
生成训练数据
数据获取模块
无人驾驶车辆
综合管理方法
煤矿井下
计划
车辆能耗信息
多域光传送网络
链路
Dijkstra算法
接收源
节点