摘要
本发明公开了一种光栅视错觉文字识别方法,首先构建具有光栅视错觉感知的DNNs文字识别模型,使用MNIST的训练集训练DNNs文字识别模型,再使用测试集测试训练好的模型,输入测试图像到文字识别模型得到侧边输出特征和多尺度融合特征,侧边输出特征通过FFIAM模块得到注意力调制的侧边输出特征,将注意力调制的侧边输出特征中特征尺寸最小的一组传入分类层,得到文字识别的概率输出,最后得到文字识别结果,完成光栅视错觉文字识别。本发明的方法引导DNNs在训练时学习到全局形状偏好而不是局部特征,以提升DNNs光栅视错觉感知能力,增强文字识别的鲁棒性,有助于提升场景字符识别任务中对印刷品、广告牌上以光栅视错觉方式呈现的文字的识别准确率,提升系统可靠性。
技术关键词
输出特征
注意力
文字识别方法
视错觉
sigmoid函数
通道
边缘检测模型
阶段
融合特征
尺寸
空洞
光栅
子模块
标签
分辨率
模块结构
视觉
多尺度
样本
系统为您推荐了相关专利信息
生成三维模型
彩色图像
颜色噪声
存储程序代码
复杂度
气象预测系统
深度学习技术
多分辨率
神经网络模型
网络处理单元