摘要
本发明涉及文本检测技术领域,公开了一种基于多重关注机制的任意形状文本检测方法及系统,基于文本基准数据集,构建训练集;构建基于多重关注机制的任意形状文本检测模型,通过预处理模块进行卷积操作,通过CBAM注意力机制模块将空间注意力与通道注意力进行串行组合来进行信息聚焦,特征提取层利用无参注意力机制SimAM改进残差块,之后通过双向特征增强模块用于信息增强及信息融合;分别利用训练集和测试集对模型进行训练,得到训练好的任意形状文本检测模型;本发明引入多重信息关注机制来提升特征提取层对关键信息的抓取能力,并使用双向特征增强模块充分利用不同层次的语义信息进行特征聚合,实现复杂场景下更加准确的文本检测。
技术关键词
文本检测模型
文本检测方法
注意力机制
全局平均池化
通道
文本检测技术
融合特征
构建训练集
模型训练模块
检测头
多层感知机
残差结构
基准
元素
分支
像素