一种混合手写体与印刷体的光学字符识别方法及系统

正文

推荐专利

申请号：CN202511074837

申请日期：2025-08-01

公开号：CN120976928A

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开一种混合手写体与印刷体的光学字符识别方法及系统，涉及计算机视觉与文档分析技术领域，采用手写体OCR模型优对输入文档图像进行手写体区域检测，并分为印刷体内联手写体、独立手写段落和表格手写体。本发明通过双通道模型架构和细粒度分类策略，解决检测精度低、模型泛化性差的问题，实现高效、轻量化的混合文本解析。改进的YOLOv12‑L模型基于空间布局、书写特征分类，可应对多样化文档场景，减少因场景差异导致的识别失效。通过分类优化，可针对性解决混合场景下的误检、复杂排版的语义断裂及表格干扰等核心问题，实现端到端手写识别的场景自适应。

技术关键词

光学字符识别方法印刷体注意力机制多任务损失函数文本识别高层语义特征书写特征光学字符识别系统表格内存压缩技术文档分析技术内存访问效率双通道模型细粒度分类场景复杂度图像分层特征多尺度特征

系统为您推荐了相关专利信息

图像生成方法、装置和电子设备

图像生成方法计算机可执行指令交叉注意力机制区域位置信息查询特征

基于预训练模型和先验知识的iNKT细胞Th1型激动剂量化预测模型

预训练模型分子无监督学习迁移学习模型疏水相互作用

工业控制系统异常检测的深度学习方法、装置、存储介质及计算机设备

工业控制系统深度学习方法网络模块物理滑动窗口

一种多模态操作指令的语义表示方法及系统

语义标签多模态指令语义层面数据

一种两阶段的多任务口腔CBCT图像分割方法

口腔CBCT图像多任务学习网络分割方法两阶段多任务损失函数

一种混合手写体与印刷体的光学字符识别方法及系统

站点导航

APP 下载