一种基于深度学习关键点定位的文档图像反卷曲方法

正文

推荐专利

申请号：CN202510452687

申请日期：2025-04-11

公开号：CN120340043B

公开日期：2025-12-05

类型：发明专利

摘要

本发明公开了一种基于深度学习关键点定位的文档图像反卷曲方法，涉及数字图像恢复技术领域，包括以下步骤：S1、数据准备；S2、模型构建；S3、模型训练；S4、反卷曲推理。通过3D渲染生成训练数据，构建轻量化深度学习网络（DenseNet+Transformer），将反卷曲问题转化为关键点定位，并采用综合损失函数优化模型。该方法无需额外硬件，模型效率高，能够在不借助任何辅助摄影硬件、3D重建算法的情况下，以较快的速度和较高的精确度实现文档图片的数字反卷曲，适用于大规模文档数字化处理。

技术关键词

卷曲方法关键点数字图像恢复技术深度学习网络扭曲文档图像特征提取模块双线性插值算法坐标摄影硬件多头注意力机制生成训练数据损失函数优化分辨率提升上采样图像还原渲染技术重建算法

系统为您推荐了相关专利信息

一种基于算法融合的全景影像标定方法及系统

矫正模型标定方法图像标定算法影像

一种基于红外热图像和可见光图像的单木分割方法

可见光图像分割方法热成像分水岭算法 Hessian矩阵

一种基于单目视觉的空中目标三维重建方法及系统

相邻两帧图像三维重建方法卡尔曼滤波修正像素关键点

一种基于隐式关键点音频驱动的数字人说话视频合成方法

关键点转换器运动编码器图像解码器运动特征

基于深度学习的屠宰线胴体长度智能实时测量方法及系统

实时测量方法关键点欧氏距离算法数据处理模块图像采集模块

一种基于深度学习关键点定位的文档图像反卷曲方法

站点导航

APP 下载