摘要
本发明公开了一种面向不完整文本图像的图像修复方法。该方法主要包括两个阶段:文本结构重建和文本图像重建。在文本结构重建阶段,接收不完整文本图像作为输入,并通过编码器、中间模块和解码器的协同工作,实现文本结构的精确分割与预测,从而获得完整文本结构二进制图像。随后,在文本图像重建阶段,将重建后的完整文本结构图像与原始不完整文本图像共同作为条件输入。该阶段由识别引导模型和扩散模型组成。识别引导模型,即场景文本识别器,它通过分析不完整文本图像,预测每个字符属于特定字符集的概率分布,为文本修复提供语义指导。在语义指导的基础上,扩散模型对不完整文本图像进行精细化修复,显著提升了文本区域的可读性和图像的保真度。
技术关键词
图像修复方法
图像重建
识别器
编码器
解码器
文本识别
通道注意力机制
噪声参数
阶段
数据分布
语义特征
分辨率
场景
字符
超参数
系统为您推荐了相关专利信息
航迹聚类方法
航迹数据
机场终端区
多层次
编码器模块
图像分割方法
注意力
参数化技术
上采样
sigmoid函数
多源信息融合分析
数据特征提取
诊断方法
故障自诊断系统
故障报警信号
多层感知机
小规模
滑动窗口
输出特征
注意力机制