一种基于频率分离的图像文本分割方法

正文

推荐专利

一种基于频率分离的图像文本分割方法

申请号：CN202411823669

申请日期：2024-12-12

公开号：CN119672727A

公开日期：2025-03-21

类型：发明专利

摘要

本发明属于计算机视觉领域中的图像文本分割领域，公开了一种基于频率分离的图像文本分割方法。先用CNN和Transformer来分别构建局部特征编码分支和全局特征编码分支，初步提取来自图像的局部特征和全局特征。在频率特征增强模块中，先使用小波变换来分解输入特征的频率。然后对得到的高频分量和低频分量，使用不同的策略进行增强。最后，利用低频信息引导网络关注文本区域附近的局部特征，减少无关背景噪声对分割结果的影响，最终获得精确的分割结果。本发明解决了图像文本分割任务中对文本检测模型的依赖，经该方法输出的结果具有高度完整性和精确性。

技术关键词

文本分割方法分支图像全局特征交叉注意力机制编码模块离散小波变换文本检测模型频率批量高频特征解码器计算机视觉背景噪声上采样网络

系统为您推荐了相关专利信息

基于多模态融合的痤疮分级方法、系统、设备及介质

痤疮多模态特征融合交叉注意力机制特征提取模块矩阵

提示表示解析的红外和可见光图像融合方法

可见光图像融合方法风格重构矩阵

一种基于深度学习大模型的UEFI固件漏洞智能化识别方法

智能化识别方法长短期记忆网络固件漏洞检测硬件平台操作系统

基于深度学习的钟表生产数据管理方法及系统

数据管理方法钟表数据管理设备退火算法哈希算法

一种视觉-语言信息交互增益的行人重识别方法与系统

信息交互增益重识别方法视觉预训练模型图像全局特征

一种基于频率分离的图像文本分割方法

站点导航

APP 下载