摘要
本发明公开了一种基于判别性特征的手写中文文本识别方法。首先对输入的文本图像进行预处理,包含文本校正和背景裁剪;然后构建基于CTC的手写中文文本识别模型,包括特征提取主干网络、辅助分类器、特征聚合模块和主分类器,所有辅助分类器的输出概率预测均参与损失计算,而主分类器则联合中心损失函数共同优化模型,实现了深监督形式的模型优化;最后进行推理预测,手写中文文本识别模型通过结合N‑gram语言模型和Beam Search解码来进一步提升识别精度。本发明通过引入包含深监督、特征聚合和中心损失的神经网络智能算法,显著提升了手写中文文本识别的性能。
技术关键词
中文文本识别
辅助分类器
判别特征
Softmax函数
文本校正
字符
像素
图像
文本行
倾斜文本
多尺度
解码技术
分层
贪婪算法
坐标
系统为您推荐了相关专利信息
掌子面
围岩级别
隧道围岩
多模态数据融合
隧道轮廓
伪造图像检测方法
伪造方法
学习器
混合网络模型
检测模型训练
图像边缘检测
绝缘子轮廓
轮廓图像
深度学习模型
导线
废旧布料
分类回收方法
偏振光
斯托克斯参量
判别特征