一种基于深度学习关键点定位的文档图像反卷曲方法

AITNT
正文
推荐专利
一种基于深度学习关键点定位的文档图像反卷曲方法
申请号:CN202510452687
申请日期:2025-04-11
公开号:CN120340043B
公开日期:2025-12-05
类型:发明专利
摘要
本发明公开了一种基于深度学习关键点定位的文档图像反卷曲方法,涉及数字图像恢复技术领域,包括以下步骤:S1、数据准备;S2、模型构建;S3、模型训练;S4、反卷曲推理。通过3D渲染生成训练数据,构建轻量化深度学习网络(DenseNet+Transformer),将反卷曲问题转化为关键点定位,并采用综合损失函数优化模型。该方法无需额外硬件,模型效率高,能够在不借助任何辅助摄影硬件、3D重建算法的情况下,以较快的速度和较高的精确度实现文档图片的数字反卷曲,适用于大规模文档数字化处理。
技术关键词
卷曲方法 关键点 数字图像恢复技术 深度学习网络 扭曲文档图像 特征提取模块 双线性插值算法 坐标 摄影硬件 多头注意力机制 生成训练数据 损失函数优化 分辨率提升 上采样 图像还原 渲染技术 重建算法
系统为您推荐了相关专利信息
1
一种基于算法融合的全景影像标定方法及系统
矫正模型 标定方法 图像 标定算法 影像
2
一种基于红外热图像和可见光图像的单木分割方法
可见光图像 分割方法 热成像 分水岭算法 Hessian矩阵
3
一种基于单目视觉的空中目标三维重建方法及系统
相邻两帧图像 三维重建方法 卡尔曼滤波修正 像素 关键点
4
一种基于隐式关键点音频驱动的数字人说话视频合成方法
关键点 转换器 运动编码器 图像解码器 运动特征
5
基于深度学习的屠宰线胴体长度智能实时测量方法及系统
实时测量方法 关键点 欧氏距离算法 数据处理模块 图像采集模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号