一种光栅视错觉文字识别方法

正文

推荐专利

一种光栅视错觉文字识别方法

申请号：CN202510177906

申请日期：2025-02-18

公开号：CN120107749B

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开了一种光栅视错觉文字识别方法，首先构建具有光栅视错觉感知的DNNs文字识别模型，使用MNIST的训练集训练DNNs文字识别模型，再使用测试集测试训练好的模型，输入测试图像到文字识别模型得到侧边输出特征和多尺度融合特征，侧边输出特征通过FFIAM模块得到注意力调制的侧边输出特征，将注意力调制的侧边输出特征中特征尺寸最小的一组传入分类层，得到文字识别的概率输出，最后得到文字识别结果，完成光栅视错觉文字识别。本发明的方法引导DNNs在训练时学习到全局形状偏好而不是局部特征，以提升DNNs光栅视错觉感知能力，增强文字识别的鲁棒性，有助于提升场景字符识别任务中对印刷品、广告牌上以光栅视错觉方式呈现的文字的识别准确率，提升系统可靠性。

技术关键词

输出特征注意力文字识别方法视错觉 sigmoid函数通道边缘检测模型阶段融合特征尺寸空洞光栅子模块标签分辨率模块结构视觉多尺度样本

系统为您推荐了相关专利信息

生成三维模型的方法、装置、电子设备和存储介质

生成三维模型彩色图像颜色噪声存储程序代码复杂度

一种基于物理规律订正深度学习技术的中长期气象预测系统及方法

气象预测系统深度学习技术多分辨率神经网络模型网络处理单元

基于交通路网权重学习的城市机动车多样化轨迹生成方法

路段机动车搜索算法矩阵车辆轨迹生成方法

一种基于Transformer模型的信息风险演变预测方法及系统

演化特征阶段生成可执行高风险节点

电力巡检的多天气鲁棒目标检测方法、装置及存储介质

神经网络模型语义特征电力巡检样本检测损失

一种光栅视错觉文字识别方法

站点导航

APP 下载