基于多模态融合的智能OCR动态自适应方法及系统

AITNT
正文
推荐专利
基于多模态融合的智能OCR动态自适应方法及系统
申请号:CN202510501064
申请日期:2025-04-21
公开号:CN120472481B
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了基于多模态融合的智能OCR动态自适应方法及系统,涉及多模态信息融合处理相关领域,该方法包括:上传多模态信息至OCR识别平台,择取第一模态信息并进行模糊扫描,执行版面解析确定版面结构;根据内容复杂度引入分层渐进融合条件,设定动态融合范式,对OCR识别平台部署的OCR引擎阵列进行初始化;根据版面结构,进行多步聚焦融合规划,触发基于第一模态信息的定向聚焦,与针对附加模态信息的实体对齐聚焦,动态配置OCR引擎与融合范式,进行多模态融合下的扫描识别管理。解决了现有多模态信息OCR处理存在的识别准确率低、适应性差的技术问题,达到了提高多模态信息OCR的识别准确率和鲁棒性的技术效果。
技术关键词
版面结构 识别平台 识别管理 动态 布局特征 多模态信息融合 复杂度 阵列 实体 分层 规划 层级 端口 格式 鲁棒性 模块 基础 标识
系统为您推荐了相关专利信息
1
一种基于区域划分的停车管理方法、设备及介质
停车管理方法 管理策略 动态二维码 车辆 建筑出入口
2
一种基于动态阈值的数据自动核验方法及装置
核验方法 校验模型 数据 动态 指标
3
一种基于半眼图像重建的轻量化眼动追踪方法
眼动追踪方法 眼球特征 动态上下文 图像重建 跨尺度特征融合
4
一种恶意软件取证系统、方法及电子设备
取证系统 软件 日志 数据获取模块 数据处理模块
5
地质灾害智慧管控系统、方法、介质、程序产品及终端
智慧管控系统 预警模块 管控方法 风险评估算法 识别模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号