一种基于自适应映射与感知调整的OCR识别方法

正文

推荐专利

申请号：CN202510489692

申请日期：2025-04-18

公开号：CN120340050B

公开日期：2025-09-02

类型：发明专利

摘要

本发明涉及计算机视觉领域，尤其涉及一种基于自适应映射与感知调整的OCR识别方法，本发明通过神经网络提取OCR图像的原始特征图，接着，通过比较原始特征图与形态学模型，计算偏差以调整卷积核的偏移量，从而精确地定位特征点，在识别文本区域时，计算每个区域的文本密度和字符间的平均间距，据此动态确定感受野的大小和形状，通过这种自适应的卷积过程生成目标特征图，最后，结合目标特征图以及文本密度和间距信息，对神经网络模型进行针对性训练，以获得优化的OCR识别模型。本发明通过对文本特征进行深入分析，显著提高了OCR技术在处理多样化和复杂文档时的识别精度和适应性。

技术关键词

识别方法神经网络模型文本 OCR识别模型字符 Softmax函数 Sigmoid函数图像密度特征点间距偏差定位特征投影技术计算机视觉边缘检测模板坐标元素排版

系统为您推荐了相关专利信息

系统热点问题的智能识别方法及装置

系统多源智能识别方法异常事件实时系统变量

视频数据的分析方法、装置及计算机设备

神经网络模型视频密钥客户端分析方法

融合意图识别与检索增强生成技术的问答处理方法、装置、设备、可读存储介质和程序产品

文本大语言模型索引机制生成技术意图识别

基于多损失梯度修正残差神经网络的航磁补偿方法及系统

残差神经网络神经网络结构补偿方法神经网络模型皮尔逊相关系数

基于大模型的多模态访谈自动化质性分析评估方法及系统

分析评估方法自动编码大语言模型互动特征语音情绪识别

一种基于自适应映射与感知调整的OCR识别方法

站点导航

APP 下载