一种面向不完整文本图像的图像修复方法

正文

推荐专利

一种面向不完整文本图像的图像修复方法

申请号：CN202411850294

申请日期：2024-12-16

公开号：CN119887586B

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种面向不完整文本图像的图像修复方法。该方法主要包括两个阶段：文本结构重建和文本图像重建。在文本结构重建阶段，接收不完整文本图像作为输入，并通过编码器、中间模块和解码器的协同工作，实现文本结构的精确分割与预测，从而获得完整文本结构二进制图像。随后，在文本图像重建阶段，将重建后的完整文本结构图像与原始不完整文本图像共同作为条件输入。该阶段由识别引导模型和扩散模型组成。识别引导模型，即场景文本识别器，它通过分析不完整文本图像，预测每个字符属于特定字符集的概率分布，为文本修复提供语义指导。在语义指导的基础上，扩散模型对不完整文本图像进行精细化修复，显著提升了文本区域的可读性和图像的保真度。

技术关键词

图像修复方法图像重建识别器编码器解码器文本识别通道注意力机制噪声参数阶段数据分布语义特征分辨率场景字符超参数

系统为您推荐了相关专利信息

一种融合时序自编码器与多层次K-Means的终端区航迹聚类方法

航迹聚类方法航迹数据机场终端区多层次编码器模块

一种面向边缘计算网络的能效服务部署与交付方法及系统

交付方法服务特征决策双时间尺度上下文特征

一种基于局部注意力和细节增强的图像分割方法、系统

图像分割方法注意力参数化技术上采样 sigmoid函数

一种基于多源信息融合分析的塔机故障自诊断方法及系统

多源信息融合分析数据特征提取诊断方法故障自诊断系统故障报警信号

一种基于小规模数据集与迁移学习的青光眼检测系统

多层感知机小规模滑动窗口输出特征注意力机制

一种面向不完整文本图像的图像修复方法

站点导航

APP 下载