摘要
本发明公开了一种手写中文文本识别方法,属于图像数据处理领域,包括步骤:获取手写中文数据集D1,其中样本为手写体文本图片,且样本中文字随机部分标注;构造一分割模块;构造一手写中文文本识别网络,包括依次连接的分割模块、识别模块、正则模块;用D1训练手写中文文本识别网络,得到手写中文文本识别模型;获取待识别手写中文文本,经手写中文文本识别模型得到对应的最终文本。本发明构造了一种全新的分割模块,能对未标注的字符也生成定位结果,做到无需人工标注真实框即可生成识别结果,降低了模型实际落地的成本,避免标注大量数据,减少成本,提高工作效率。且本发明能确保语义语境通顺流畅,得到的最终文本准确率高。
技术关键词
中文文本识别
识别模块
图像数据处理
网络
脱机手写
样本
字符
更新方法
语义
图片
场景
纠错
坐标
参数