基于边界适应的无人机视角文本检测模型

AITNT
正文
推荐专利
基于边界适应的无人机视角文本检测模型
申请号:CN202411609857
申请日期:2024-11-12
公开号:CN119478744A
公开日期:2025-02-18
类型:发明专利
摘要
本发明涉及无人机视角文本检测技术领域,公开了一种基于边界适应的无人机视角文本检测模型,首先,使用ResNet50作为主干网络,并提出混合文本注意力机制,且将其引入到特征提取模块中,以增强对文本区域的感知能力。此外,本发明提出一种空间特征融合模块,用于自适应融合不同尺度的文本特征,从而增强模型的适应性。最后,本发明通过在文本细节边界迭代优化模块的Transformer中引入局部特征提取器,实现了复杂背景干扰下的文本边界精确优化和定位,避免了复杂的后处理步骤。在具有挑战性的文本检测数据集以及基于无人机的文本检测数据集上的大量实验验证了我们提出的方法的高鲁棒性和先进的性能,为实际应用奠定了坚实基础。
技术关键词
文本检测模型 无人机 通道注意力机制 局部特征提取 视角 融合多尺度特征 池化特征 文本检测技术 变换器 上下文特征 图像结构 特征提取模块 加权特征 语义 纹理特征 输出特征
系统为您推荐了相关专利信息
1
基于联邦学习的医学影像分类方法、装置及系统
混合编码器 医学影像分类方法 医学影像信息 自动编码器 多分辨率
2
基于无人机的体育场馆内部全景安全巡查方法
巡查方法 体育场馆 原始图像数据 热力图 三维地形模型
3
太阳能载人无人机
载人无人机 太阳能 光伏板 机身 电源管理模块
4
基于知识图谱的健康状态评估与产品匹配方法及系统
健康知识图谱 产品组合 转移概率矩阵 时间卷积网络 产品匹配方法
5
下咽癌诱导化疗预后预测及治疗方案的处理方法和装置及介质
多模态信息 CT影像组学特征 多模态特征融合 深度学习特征 深度学习网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号