一种基于频率分离的图像文本分割方法

AITNT
正文
推荐专利
一种基于频率分离的图像文本分割方法
申请号:CN202411823669
申请日期:2024-12-12
公开号:CN119672727A
公开日期:2025-03-21
类型:发明专利
摘要
本发明属于计算机视觉领域中的图像文本分割领域,公开了一种基于频率分离的图像文本分割方法。先用CNN和Transformer来分别构建局部特征编码分支和全局特征编码分支,初步提取来自图像的局部特征和全局特征。在频率特征增强模块中,先使用小波变换来分解输入特征的频率。然后对得到的高频分量和低频分量,使用不同的策略进行增强。最后,利用低频信息引导网络关注文本区域附近的局部特征,减少无关背景噪声对分割结果的影响,最终获得精确的分割结果。本发明解决了图像文本分割任务中对文本检测模型的依赖,经该方法输出的结果具有高度完整性和精确性。
技术关键词
文本分割方法 分支 图像全局特征 交叉注意力机制 编码模块 离散小波变换 文本检测模型 频率 批量 高频特征 解码器 计算机视觉 背景噪声 上采样 网络
系统为您推荐了相关专利信息
1
基于多模态融合的痤疮分级方法、系统、设备及介质
痤疮 多模态特征融合 交叉注意力机制 特征提取模块 矩阵
2
提示表示解析的红外和可见光图像融合方法
可见光图像 融合方法 风格 重构 矩阵
3
一种基于深度学习大模型的UEFI固件漏洞智能化识别方法
智能化识别方法 长短期记忆网络 固件漏洞检测 硬件平台 操作系统
4
基于深度学习的钟表生产数据管理方法及系统
数据管理方法 钟表 数据管理设备 退火算法 哈希算法
5
一种视觉-语言信息交互增益的行人重识别方法与系统
信息交互增益 重识别方法 视觉 预训练模型 图像全局特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号