摘要
一种文本识别方法,其具体步骤如下:S1,建立基于改进型CRNN结构的文本识别模型,所述改进型CRNN结构的输出包括双行输出序列分支和单行输出序列分支;S2,输入图片对文本识别模型进行训练,单行图输入文本识别模型后训练单行输出序列分支,双行图输入文本识别模型后训练双行输出序列分支,损失函数为引入编辑距离的CTC Loss作为损失函数;S3,带识别图片输入文本识别模型后同时识别单行文本和双行文本。本发明通过引入编辑距离,改进了CTC Loss损失函数,从而使损失函数的优化过程更加平滑。不仅明显提升了训练收敛速度,对训练精度也有一定提升。通过改进CRNN结构,既能单行文本识别、又能双行文本识别。
技术关键词
文本识别模型
文本识别方法
分支
序列
编辑
图片
字符
标签
图像
精度
速度
系统为您推荐了相关专利信息
工业知识图谱
前馈神经网络
计算机可执行指令
多头注意力机制
词语
室内用户定位方法
信道响应估计
信道估计模型
超表面
深度特征提取