摘要
本发明公开了基于跨级特征增强和辅助特征指导的文本检测方法及系统,涉及计算机视觉技术领域;该方法包括如下步骤:对待检测图像提取不同层级的特征图;对于低层级特征,采用调节卷积核大小的方式动态调整感受野以获得多尺度信息,生成低层级特征的增强特征;对于高层级特征,采用差分卷积增强文本边缘高频信息,生成高层级特征的增强特征;采用跨级特征增强的方式融合来自不同层级的特征,生成融合特征;提取高层级特征的语义信息,生成辅助特征;对于生成的辅助特征和融合特征,采用注意力指导的方式判别文本核像素的归属,得到注意力指导后的特征;对像素进行文本‑非文本预测,生成文本边界框。本发明中方案使网络能更加正确分割文本区域。
技术关键词
文本检测方法
融合特征
层级
注意力
多尺度信息
像素
上采样
全局平均池化
双线性插值法
计算机视觉技术
通道
语义
分辨率
采样率
多尺度特征
阶段
池化特征
动态
分支
系统为您推荐了相关专利信息
闭环控制回路
子系统
神经调控系统
多模态生理
植入式脉冲发生器
故障诊断方法
矩阵
稀疏编码模型
高压电气设备
分层特征