一种基于自适应特征融合的图像场景文本检测方法

正文

推荐专利

申请号：CN202410899366

申请日期：2024-07-05

公开号：CN118887648A

公开日期：2024-11-01

类型：发明专利

摘要

本发明提供了一种基于自适应特征融合的图像场景文本检测方法。该方法包括：使用ResNet主干网络对待处理的场景文本图像进行多尺度特征(x2,x3,x4,x5)提取，使用特征金字塔网络对多尺度特征(x2,x3,x4,x5)进行初步的多尺度特征融合，输出经过融合的多尺度特征(o2,o3,o4,o5)，并输入到特征混迭模块得到多尺度特征(p2,p3,p4,p5)；将多尺度特征(p2,p3,p4,p5)进行拼接得到多尺度特征矩阵P；使用通道注意力模块对多尺度特征矩阵P进行自适应特征融合，得到经过融合的多尺度特征Q；对Q进行可微二值化后处理得到概率图和阈值图，根据概率图和阈值图得到待处理的场景文本图像中场景文本检测结果。本发明对多尺度特征从通道维度到空间维度进行特征混迭，有效提高了不同尺度特征的表达能力，提高了文本检测算法的性能。

技术关键词

场景文本图像特征金字塔网络场景文本检测方法注意力通道多尺度特征提取模块矩阵因子像素阶段输出特征元素算法尺寸

系统为您推荐了相关专利信息

能够实现试剂定量取液的微流控芯片及试剂定量取用方法

胶塞排气通道取用方法空气腔滤芯

电力信息物理系统高危信息-物理协同故障的跨域传播路径确定方法及系统

电力信息物理系统双层优化模型负荷变量阶段

基于多视角物体轨迹预测的机器人技能迁移方法及系统

多视角编码模块交叉注意力机制迁移方法感知特征

一种猫眼智能门锁系统及视频显示方法

智能门锁系统猫眼视频显示方法视频流服务器模块

一种基于多尺度训练策略的非定常流场预测方法

覆盖率协方差矩阵残差模块多尺度误差

一种基于自适应特征融合的图像场景文本检测方法

站点导航

APP 下载