一种面向不完整文本图像的图像修复方法

AITNT
正文
推荐专利
一种面向不完整文本图像的图像修复方法
申请号:CN202411850294
申请日期:2024-12-16
公开号:CN119887586B
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种面向不完整文本图像的图像修复方法。该方法主要包括两个阶段:文本结构重建和文本图像重建。在文本结构重建阶段,接收不完整文本图像作为输入,并通过编码器、中间模块和解码器的协同工作,实现文本结构的精确分割与预测,从而获得完整文本结构二进制图像。随后,在文本图像重建阶段,将重建后的完整文本结构图像与原始不完整文本图像共同作为条件输入。该阶段由识别引导模型和扩散模型组成。识别引导模型,即场景文本识别器,它通过分析不完整文本图像,预测每个字符属于特定字符集的概率分布,为文本修复提供语义指导。在语义指导的基础上,扩散模型对不完整文本图像进行精细化修复,显著提升了文本区域的可读性和图像的保真度。
技术关键词
图像修复方法 图像重建 识别器 编码器 解码器 文本识别 通道注意力机制 噪声参数 阶段 数据分布 语义特征 分辨率 场景 字符 超参数
系统为您推荐了相关专利信息
1
一种融合时序自编码器与多层次K-Means的终端区航迹聚类方法
航迹聚类方法 航迹数据 机场终端区 多层次 编码器模块
2
一种面向边缘计算网络的能效服务部署与交付方法及系统
交付方法 服务特征 决策 双时间尺度 上下文特征
3
一种基于局部注意力和细节增强的图像分割方法、系统
图像分割方法 注意力 参数化技术 上采样 sigmoid函数
4
一种基于多源信息融合分析的塔机故障自诊断方法及系统
多源信息融合分析 数据特征提取 诊断方法 故障自诊断系统 故障报警信号
5
一种基于小规模数据集与迁移学习的青光眼检测系统
多层感知机 小规模 滑动窗口 输出特征 注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号