摘要
本发明涉及深度学习图像文本检测技术领域,具体涉及一种面向自然场景的文本检测方法,基于backbone、neck和head三个部分改进获得文本检测网络,再将训练集输入文本检测网络进行迭代训练,获得最终结果。具体为在骨干网络特征提取时,使用EANet block结构替换ResNet Bottleneck,通过EANet包含的PSA模块和CSA模块,多尺度的提取特征信息和关注空间信息,有效地保留有效信息从而提高检测精度;同时还引入SE模块和残余结构增强网络对文本信息的定位;最后可微分二值化算法和注意力机制应用到文本检测中,解决了文本检测时特征丢失的问题,并提高了文本检测网络的检测精度。
技术关键词
文本检测方法
自然场景
二值化算法
文本检测技术
深度学习图像
网络
多尺度特征提取
模块
残差结构
训练集
注意力机制
图片
坐标点
上采样
样本
表达式
精度
级联
系统为您推荐了相关专利信息
Attention机制
表格抽取方法
表格区域识别
感知损失函数
合并单元格
远程监测方法
重构模型
电阻抗成像
成像数据处理方法
持续优化方法
可见光图像
伪标签生成器
融合特征
像素
Retinex算法
聚能药包
深度学习图像分割技术
地震反射数据
侧扫声呐
定位方法