半监督场景文本识别方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202410824780

申请日期：2024-06-25

公开号：CN118379744B

公开日期：2024-08-20

类型：发明专利

摘要

本发明公开了一种半监督场景文本识别方法、系统、设备及存储介质，它们是一一对应的方案，方案中：关注了字符形态特征，通过采用半监督学习的场景文本识别框架，同时使用简单的合成数据（有标注的图像数据）和无标注的图像数据进行训练，并且通过对文本图像字符形式进行统一化，降低了困难样本的识别难度，其次提出复杂样本在线生成策略和字符单向对齐损失，使得模型能够对具有背景噪声和复杂字符形态的文本图像提取纯净有效的字符特征，进而实现仅从简单的合成训练数据集中泛化出识别复杂文本的能力。大量的实验证明了本发明的性能优于之前的方法，能够以较少的模型参数量和较快的推理速度对困难文本图像进行准确地识别。

技术关键词

场景文本识别方法字符教师学生图像数据样本解码器标签编码器分类器序列文本识别系统生成字体半监督学习符号门槛

系统为您推荐了相关专利信息

一种多模态的医学图像异常检测方法、介质和设备

图像异常检测方法医学神经网络模型适配器样本

一种玻璃检测辅助固定设备

辅助固定设备检测箱夹持组件除尘风管下安装板

一种基于多模态融合数据的口腔曲线三维自动拟合方法及系统

数字化牙颌模型自动拟合方法多模态曲线颅骨

一种基于背景抑制的可微分二值化文本检测方法及系统

文本检测模型文本检测方法代表文本检测技术感兴趣

一种基于改进孤立森林算法的关键部件热异常检测方法

热异常检测孤立森林算法森林模型热像仪 Softmax函数

半监督场景文本识别方法、系统、设备及存储介质

站点导航

APP 下载