摘要
本发明公开了一种半监督场景文本识别方法、系统、设备及存储介质,它们是一一对应的方案,方案中:关注了字符形态特征,通过采用半监督学习的场景文本识别框架,同时使用简单的合成数据(有标注的图像数据)和无标注的图像数据进行训练,并且通过对文本图像字符形式进行统一化,降低了困难样本的识别难度,其次提出复杂样本在线生成策略和字符单向对齐损失,使得模型能够对具有背景噪声和复杂字符形态的文本图像提取纯净有效的字符特征,进而实现仅从简单的合成训练数据集中泛化出识别复杂文本的能力。大量的实验证明了本发明的性能优于之前的方法,能够以较少的模型参数量和较快的推理速度对困难文本图像进行准确地识别。
技术关键词
场景文本识别方法
字符
教师
学生
图像
数据
样本
解码器
标签
编码器
分类器
序列
文本识别系统
生成字体
半监督学习
符号
门槛
系统为您推荐了相关专利信息
图像异常检测方法
医学
神经网络模型
适配器
样本
辅助固定设备
检测箱
夹持组件
除尘风管
下安装板
文本检测模型
文本检测方法
代表
文本检测技术
感兴趣
热异常检测
孤立森林算法
森林模型
热像仪
Softmax函数