摘要
本发明涉及无人机视角文本检测技术领域,公开了一种基于边界适应的无人机视角文本检测模型,首先,使用ResNet50作为主干网络,并提出混合文本注意力机制,且将其引入到特征提取模块中,以增强对文本区域的感知能力。此外,本发明提出一种空间特征融合模块,用于自适应融合不同尺度的文本特征,从而增强模型的适应性。最后,本发明通过在文本细节边界迭代优化模块的Transformer中引入局部特征提取器,实现了复杂背景干扰下的文本边界精确优化和定位,避免了复杂的后处理步骤。在具有挑战性的文本检测数据集以及基于无人机的文本检测数据集上的大量实验验证了我们提出的方法的高鲁棒性和先进的性能,为实际应用奠定了坚实基础。
技术关键词
文本检测模型
无人机
通道注意力机制
局部特征提取
视角
融合多尺度特征
池化特征
文本检测技术
变换器
上下文特征
图像结构
特征提取模块
加权特征
语义
纹理特征
输出特征
系统为您推荐了相关专利信息
混合编码器
医学影像分类方法
医学影像信息
自动编码器
多分辨率
巡查方法
体育场馆
原始图像数据
热力图
三维地形模型
健康知识图谱
产品组合
转移概率矩阵
时间卷积网络
产品匹配方法
多模态信息
CT影像组学特征
多模态特征融合
深度学习特征
深度学习网络模型