半监督场景文本识别方法、系统、设备及存储介质

AITNT
正文
推荐专利
半监督场景文本识别方法、系统、设备及存储介质
申请号:CN202410824780
申请日期:2024-06-25
公开号:CN118379744B
公开日期:2024-08-20
类型:发明专利
摘要
本发明公开了一种半监督场景文本识别方法、系统、设备及存储介质,它们是一一对应的方案,方案中:关注了字符形态特征,通过采用半监督学习的场景文本识别框架,同时使用简单的合成数据(有标注的图像数据)和无标注的图像数据进行训练,并且通过对文本图像字符形式进行统一化,降低了困难样本的识别难度,其次提出复杂样本在线生成策略和字符单向对齐损失,使得模型能够对具有背景噪声和复杂字符形态的文本图像提取纯净有效的字符特征,进而实现仅从简单的合成训练数据集中泛化出识别复杂文本的能力。大量的实验证明了本发明的性能优于之前的方法,能够以较少的模型参数量和较快的推理速度对困难文本图像进行准确地识别。
技术关键词
场景文本识别方法 字符 教师 学生 图像 数据 样本 解码器 标签 编码器 分类器 序列 文本识别系统 生成字体 半监督学习 符号 门槛
系统为您推荐了相关专利信息
1
一种多模态的医学图像异常检测方法、介质和设备
图像异常检测方法 医学 神经网络模型 适配器 样本
2
一种玻璃检测辅助固定设备
辅助固定设备 检测箱 夹持组件 除尘风管 下安装板
3
一种基于多模态融合数据的口腔曲线三维自动拟合方法及系统
数字化牙颌模型 自动拟合方法 多模态 曲线 颅骨
4
一种基于背景抑制的可微分二值化文本检测方法及系统
文本检测模型 文本检测方法 代表 文本检测技术 感兴趣
5
一种基于改进孤立森林算法的关键部件热异常检测方法
热异常检测 孤立森林算法 森林模型 热像仪 Softmax函数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号