摘要
本申请涉及图像处理技术领域,公开了一种文档图像矫正方法、装置、设备、存储介质及计算机程序产品,该方法包括:将待矫正文档图像输入文档图像矫正模型,其中,文档图像矫正模型中设置有掩码引导模块,通过掩码引导模块引导文档图像矫正模型的注意力集中于待矫正文档图像的前景区域,获得扭曲形变场,基于扭曲形变场对待矫正文档图像进行矫正,获得矫正后文档图像;由于本申请通过掩码引导模块促使模型强化对前景元素几何特征的感知,使模型在处理文档图像时,优先关注对文档内容理解至关重要的前景元素,减少对背景噪声的关注,从而解决了相关方法在处理复杂几何扭曲时前景元素易失真的问题,提高了校正结果的准确性,进而提升了用户体验。
技术关键词
矫正模型
图像矫正方法
图像矫正装置
注意力
计算机程序产品
矫正设备
特征提取模块
元素
处理器
图像处理技术
编码器
背景噪声
输入模块
存储器
数据
序列
系统为您推荐了相关专利信息
通信方法
梅尔频率倒谱系数
滑动窗口
参数
强化特征
长短期记忆网络
负载预测方法
电力系统
非易失性存储介质
长短期记忆单元
自动分割方法
深度学习模型
中心线
图像编码器
非暂态计算机可读存储介质
三维重建系统
非线性优化算法
径向基函数插值
面部特征
颞下颌关节