摘要
本申请公开了一种扫描文件识别方法和相关装置,涉及图像处理技术领域。该方法包括:获取包括印刷字图像和手写字图像的目标扫描文件;将目标扫描文件输入检测模型,获得目标扫描文件的实例分割结果。其中,实例分割结果展示目标扫描文件被分割成的多个区域,每个区域对应一个印刷字图像或对应一个手写字图像。由于本申请中的检测模型是以二阶段检测模型为基础,融入特征融合模块、注意力机制和边界细化模块后,经过训练得到模型,所以使用本申请中的检测模型可以准确地将每份扫描文件中的印刷字图像和手写字图像分割开,解决现有方法中分割边界模糊的问题,提高扫描文件的识别准确度。
技术关键词
文件识别方法
实例分割
注意力机制
模块
多尺度特征
多层感知机
图像像素
空洞
阶段
元素
图像处理技术
图像分割
识别装置
可读存储介质
网络
基础
存储器
处理器
误差