摘要
本发明涉及图像文档处理相关领域,公开了一种从图像中提取文档的方法及模型,通过采用深度学习监督方式进行目标场景拟合,数据集来源为合成方式,具备泛化到真实目标场景能力,能够有效的应对图像中文案的随机性和内容的复杂性,高效且迅速的对需要进行识别的图像文档区域进行定位和匹配。
技术关键词
坐标
关键点
物体检测
样本
图像分割
指图像
特征金字塔网络
注意力机制
多任务
图像缩放
检测器
参数
多尺度
精度
标签
像素
场景
阶段
系统为您推荐了相关专利信息
电力系统潮流
多层次
构建深度神经网络
累积分布函数
样本
农作物虫害
红外热成像监测
策略
周期性特征
热成像设备
概率密度函数
不良品
贝叶斯概率模型
贝叶斯模型
电感
心理状态评估方法
文本
音频
融合特征
注意力机制