一种面向自然场景的文本检测方法

正文

推荐专利

一种面向自然场景的文本检测方法

申请号：CN202411072196

申请日期：2024-08-06

公开号：CN118799854A

公开日期：2024-10-18

类型：发明专利

摘要

本发明涉及深度学习图像文本检测技术领域，具体涉及一种面向自然场景的文本检测方法，基于backbone、neck和head三个部分改进获得文本检测网络，再将训练集输入文本检测网络进行迭代训练，获得最终结果。具体为在骨干网络特征提取时，使用EANet block结构替换ResNet Bottleneck，通过EANet包含的PSA模块和CSA模块，多尺度的提取特征信息和关注空间信息，有效地保留有效信息从而提高检测精度；同时还引入SE模块和残余结构增强网络对文本信息的定位；最后可微分二值化算法和注意力机制应用到文本检测中，解决了文本检测时特征丢失的问题，并提高了文本检测网络的检测精度。

技术关键词

文本检测方法自然场景二值化算法文本检测技术深度学习图像网络多尺度特征提取模块残差结构训练集注意力机制图片坐标点上采样样本表达式精度级联

系统为您推荐了相关专利信息

一种基于混合视觉策略的异构表格抽取方法

Attention机制表格抽取方法表格区域识别感知损失函数合并单元格

一种基于云边协同的电阻抗成像及远程监测方法

远程监测方法重构模型电阻抗成像成像数据处理方法持续优化方法

一种印章内容识别方法、系统及介质

印章内容识别方法文本检测方法坐标图像

一种基于边缘信息引导的伪监督学习交通图像质量增强方法

可见光图像伪标签生成器融合特征像素 Retinex算法

一种海域水下UXO定位方法、系统及水下UXO处理工艺

聚能药包深度学习图像分割技术地震反射数据侧扫声呐定位方法

一种面向自然场景的文本检测方法

站点导航

APP 下载