基于多模态融合的智能OCR动态自适应方法及系统

正文

推荐专利

申请号：CN202510501064

申请日期：2025-04-21

公开号：CN120472481B

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了基于多模态融合的智能OCR动态自适应方法及系统，涉及多模态信息融合处理相关领域，该方法包括：上传多模态信息至OCR识别平台，择取第一模态信息并进行模糊扫描，执行版面解析确定版面结构；根据内容复杂度引入分层渐进融合条件，设定动态融合范式，对OCR识别平台部署的OCR引擎阵列进行初始化；根据版面结构，进行多步聚焦融合规划，触发基于第一模态信息的定向聚焦，与针对附加模态信息的实体对齐聚焦，动态配置OCR引擎与融合范式，进行多模态融合下的扫描识别管理。解决了现有多模态信息OCR处理存在的识别准确率低、适应性差的技术问题，达到了提高多模态信息OCR的识别准确率和鲁棒性的技术效果。

技术关键词

版面结构识别平台识别管理动态布局特征多模态信息融合复杂度阵列实体分层规划层级端口格式鲁棒性模块基础标识

系统为您推荐了相关专利信息

一种基于区域划分的停车管理方法、设备及介质

停车管理方法管理策略动态二维码车辆建筑出入口

一种基于动态阈值的数据自动核验方法及装置

核验方法校验模型数据动态指标

一种基于半眼图像重建的轻量化眼动追踪方法

眼动追踪方法眼球特征动态上下文图像重建跨尺度特征融合

一种恶意软件取证系统、方法及电子设备

取证系统软件日志数据获取模块数据处理模块

地质灾害智慧管控系统、方法、介质、程序产品及终端

智慧管控系统预警模块管控方法风险评估算法识别模块

基于多模态融合的智能OCR动态自适应方法及系统

站点导航

APP 下载