摘要
本发明公开了一种基于深度学习关键点定位的文档图像反卷曲方法,涉及数字图像恢复技术领域,包括以下步骤:S1、数据准备;S2、模型构建;S3、模型训练;S4、反卷曲推理。通过3D渲染生成训练数据,构建轻量化深度学习网络(DenseNet+Transformer),将反卷曲问题转化为关键点定位,并采用综合损失函数优化模型。该方法无需额外硬件,模型效率高,能够在不借助任何辅助摄影硬件、3D重建算法的情况下,以较快的速度和较高的精确度实现文档图片的数字反卷曲,适用于大规模文档数字化处理。
技术关键词
卷曲方法
关键点
数字图像恢复技术
深度学习网络
扭曲文档图像
特征提取模块
双线性插值算法
坐标
摄影硬件
多头注意力机制
生成训练数据
损失函数优化
分辨率提升
上采样
图像还原
渲染技术
重建算法
系统为您推荐了相关专利信息
可见光图像
分割方法
热成像
分水岭算法
Hessian矩阵
相邻两帧图像
三维重建方法
卡尔曼滤波修正
像素
关键点
实时测量方法
关键点
欧氏距离算法
数据处理模块
图像采集模块