摘要
本发明公开了一种基于特征融合和注意力增强的自然场景文本检测方法,包括以下步骤:获取待检测图像;构建自然场景下的文本检测模型,用于对图像中的文本信息进行提取;对所述自然场景下的文本检测模型进行训练,得到训练好的自然场景下的文本检测模型;将待检测图像输入到训练好的自然场景下的文本检测模型中,实现对图像中包含的文本信息进行提取。通过注意力增强模块,使得模型对文本实例信息更加敏感,增强对不规则文本实例的检测;最终实现对自然场景文本检测性能的提升。通过主观观感和准确率和召回率等各项指标在主流数据集上的表现结果,表明该发明在自然场景文本检测方面有重要的意义。
技术关键词
自然场景文本检测
文本检测模型
代表
通道
前馈神经网络
多尺度特征
图像
编码器
注意力机制
背景噪声
尺寸
模块
矩阵
分支
解码器
字符
系统为您推荐了相关专利信息
积层
Softmax函数
模型超参数
图像
优化器
BB84协议
密钥管理设备
序列
密钥生成速率
接收方