一种光栅视错觉文字识别方法

AITNT
正文
推荐专利
一种光栅视错觉文字识别方法
申请号:CN202510177906
申请日期:2025-02-18
公开号:CN120107749B
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开了一种光栅视错觉文字识别方法,首先构建具有光栅视错觉感知的DNNs文字识别模型,使用MNIST的训练集训练DNNs文字识别模型,再使用测试集测试训练好的模型,输入测试图像到文字识别模型得到侧边输出特征和多尺度融合特征,侧边输出特征通过FFIAM模块得到注意力调制的侧边输出特征,将注意力调制的侧边输出特征中特征尺寸最小的一组传入分类层,得到文字识别的概率输出,最后得到文字识别结果,完成光栅视错觉文字识别。本发明的方法引导DNNs在训练时学习到全局形状偏好而不是局部特征,以提升DNNs光栅视错觉感知能力,增强文字识别的鲁棒性,有助于提升场景字符识别任务中对印刷品、广告牌上以光栅视错觉方式呈现的文字的识别准确率,提升系统可靠性。
技术关键词
输出特征 注意力 文字识别方法 视错觉 sigmoid函数 通道 边缘检测模型 阶段 融合特征 尺寸 空洞 光栅 子模块 标签 分辨率 模块结构 视觉 多尺度 样本
系统为您推荐了相关专利信息
1
生成三维模型的方法、装置、电子设备和存储介质
生成三维模型 彩色图像 颜色噪声 存储程序代码 复杂度
2
一种基于物理规律订正深度学习技术的中长期气象预测系统及方法
气象预测系统 深度学习技术 多分辨率 神经网络模型 网络处理单元
3
基于交通路网权重学习的城市机动车多样化轨迹生成方法
路段 机动车 搜索算法 矩阵 车辆轨迹生成方法
4
一种基于Transformer模型的信息风险演变预测方法及系统
演化特征 阶段 生成可执行 高风险 节点
5
电力巡检的多天气鲁棒目标检测方法、装置及存储介质
神经网络模型 语义特征 电力巡检 样本 检测损失
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号