摘要
本发明公开了基于多模态融合的智能OCR动态自适应方法及系统,涉及多模态信息融合处理相关领域,该方法包括:上传多模态信息至OCR识别平台,择取第一模态信息并进行模糊扫描,执行版面解析确定版面结构;根据内容复杂度引入分层渐进融合条件,设定动态融合范式,对OCR识别平台部署的OCR引擎阵列进行初始化;根据版面结构,进行多步聚焦融合规划,触发基于第一模态信息的定向聚焦,与针对附加模态信息的实体对齐聚焦,动态配置OCR引擎与融合范式,进行多模态融合下的扫描识别管理。解决了现有多模态信息OCR处理存在的识别准确率低、适应性差的技术问题,达到了提高多模态信息OCR的识别准确率和鲁棒性的技术效果。
技术关键词
版面结构
识别平台
识别管理
动态
布局特征
多模态信息融合
复杂度
阵列
实体
分层
规划
层级
端口
格式
鲁棒性
模块
基础
标识
系统为您推荐了相关专利信息
停车管理方法
管理策略
动态二维码
车辆
建筑出入口
眼动追踪方法
眼球特征
动态上下文
图像重建
跨尺度特征融合
智慧管控系统
预警模块
管控方法
风险评估算法
识别模块