摘要
本发明属于计算机视觉领域中的图像文本分割领域,公开了一种基于频率分离的图像文本分割方法。先用CNN和Transformer来分别构建局部特征编码分支和全局特征编码分支,初步提取来自图像的局部特征和全局特征。在频率特征增强模块中,先使用小波变换来分解输入特征的频率。然后对得到的高频分量和低频分量,使用不同的策略进行增强。最后,利用低频信息引导网络关注文本区域附近的局部特征,减少无关背景噪声对分割结果的影响,最终获得精确的分割结果。本发明解决了图像文本分割任务中对文本检测模型的依赖,经该方法输出的结果具有高度完整性和精确性。
技术关键词
文本分割方法
分支
图像全局特征
交叉注意力机制
编码模块
离散小波变换
文本检测模型
频率
批量
高频特征
解码器
计算机视觉
背景噪声
上采样
网络
系统为您推荐了相关专利信息
痤疮
多模态特征融合
交叉注意力机制
特征提取模块
矩阵
智能化识别方法
长短期记忆网络
固件漏洞检测
硬件平台
操作系统
数据管理方法
钟表
数据管理设备
退火算法
哈希算法
信息交互增益
重识别方法
视觉
预训练模型
图像全局特征