摘要
本发明公开了一种基于上下文引导和语义补偿的任意场景文本检测方法,属于计算机视觉技术领域;本发明提出了一种基于上下文引导和语义补偿的任意场景文本检测方法,旨在解决文本边界区域错误分割的问题,以精准定位场景图像中的文本实例。本发明主要包括上下文引导的特征增强模块、高级语义信息补偿模块,其中上下文力引导的特征增强模块通过结合卷积和注意力,学习局部和全局上下文信息,对复杂的文本特征进行充分建模;而高级语义补偿模块能够弥补了融合特征中缺失的高级语义信息,从而增强了特征表达的语义丰富性和准确性。
技术关键词
场景文本检测方法
注意力
语义
融合特征
校准
Sigmoid函数
双线性插值
重采样技术
场景文本检测系统
分支
输出特征
全局平均池化
多级特征
矩阵
模块
Softmax函数
通道
网络
ReLU函数
系统为您推荐了相关专利信息
SAR图像识别
识别方法
蒸馏
异源
通道注意力机制
核查方法
词嵌入模型
自然语言
结构化查询语句
数据
供用电
信息定位方法
单据
信息定位装置
文本检测模型