一种基于特征融合和注意力增强的自然场景文本检测方法

正文

推荐专利

申请号：CN202511423595

申请日期：2025-09-30

公开号：CN121033869A

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种基于特征融合和注意力增强的自然场景文本检测方法，包括以下步骤：获取待检测图像；构建自然场景下的文本检测模型，用于对图像中的文本信息进行提取；对所述自然场景下的文本检测模型进行训练，得到训练好的自然场景下的文本检测模型；将待检测图像输入到训练好的自然场景下的文本检测模型中，实现对图像中包含的文本信息进行提取。通过注意力增强模块，使得模型对文本实例信息更加敏感，增强对不规则文本实例的检测；最终实现对自然场景文本检测性能的提升。通过主观观感和准确率和召回率等各项指标在主流数据集上的表现结果，表明该发明在自然场景文本检测方面有重要的意义。

技术关键词

自然场景文本检测文本检测模型代表通道前馈神经网络多尺度特征图像编码器注意力机制背景噪声尺寸模块矩阵分支解码器字符