一种基于图像识别的文字提取方法

正文

推荐专利

一种基于图像识别的文字提取方法

申请号：CN202411445926

申请日期：2024-10-16

公开号：CN119672722A

公开日期：2025-03-21

类型：发明专利

摘要

本发明提出了一种基于图像识别的文字提取方法，利用图像采集装置获取文本图像，使用高斯低通滤波算法降噪处理，拉普拉斯算子增强图像的边缘和细节，人工检查并进行旋转调整；文本检测和内容识别分开针对训练，集成识别；强化YOLOv8回归检测头提高预测文本框的精度以及减少模型预测过程中非极大抑制操作提升效率，文本内容识别采用基于Transformer的特征融合扩展模型，通过自身特征扩展和交叉融合扩展方式提升文本识别精度，内容识别模型的训练数据集来自本文区域检测保存的结果；通过CTC损失引入“空”字符的方式对内容识别模型进行训练。本发明可以有效识别文本图像，提高了模型检测速度和精度。

技术关键词

文字提取方法文本检测模型文本识别字符检测头拉普拉斯多头注意力机制多分支前馈神经网络图像采集装置精度标签扩展模块数据

系统为您推荐了相关专利信息

数据处理方法、装置、设备、存储介质及产品

数据处理方法协议国际漫游技术邮件坐标

基于双分支网络架构的多模态遥感图像关键点检测方法

双分支网络深度神经网络模型遥感图像数据特征描述符关键点

基于稀疏DETR模型的SAR图像目标智能检测方法

训练图像数据编码器智能检测方法解码器多尺度特征

面向中医药垂直领域的大模型构建方法及装置

中医药模型构建方法数据教科书模型构建装置

网络教学视频知识点分类提取方法、装置、设备及介质

知识点标签关键帧分类提取方法教学字符识别模型

一种基于图像识别的文字提取方法

站点导航

APP 下载