一种面向自然场景的文本检测方法

AITNT
正文
推荐专利
一种面向自然场景的文本检测方法
申请号:CN202411072196
申请日期:2024-08-06
公开号:CN118799854A
公开日期:2024-10-18
类型:发明专利
摘要
本发明涉及深度学习图像文本检测技术领域,具体涉及一种面向自然场景的文本检测方法,基于backbone、neck和head三个部分改进获得文本检测网络,再将训练集输入文本检测网络进行迭代训练,获得最终结果。具体为在骨干网络特征提取时,使用EANet block结构替换ResNet Bottleneck,通过EANet包含的PSA模块和CSA模块,多尺度的提取特征信息和关注空间信息,有效地保留有效信息从而提高检测精度;同时还引入SE模块和残余结构增强网络对文本信息的定位;最后可微分二值化算法和注意力机制应用到文本检测中,解决了文本检测时特征丢失的问题,并提高了文本检测网络的检测精度。
技术关键词
文本检测方法 自然场景 二值化算法 文本检测技术 深度学习图像 网络 多尺度特征提取 模块 残差结构 训练集 注意力机制 图片 坐标点 上采样 样本 表达式 精度 级联
系统为您推荐了相关专利信息
1
一种基于混合视觉策略的异构表格抽取方法
Attention机制 表格抽取方法 表格区域识别 感知损失函数 合并单元格
2
一种基于云边协同的电阻抗成像及远程监测方法
远程监测方法 重构模型 电阻抗成像 成像数据处理方法 持续优化方法
3
一种印章内容识别方法、系统及介质
印章 内容识别方法 文本检测方法 坐标 图像
4
一种基于边缘信息引导的伪监督学习交通图像质量增强方法
可见光图像 伪标签生成器 融合特征 像素 Retinex算法
5
一种海域水下UXO定位方法、系统及水下UXO处理工艺
聚能药包 深度学习图像分割技术 地震反射数据 侧扫声呐 定位方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号