摘要
本发明提供一种自然场景下文档类财务报告识别方法及装置,包括:接收待识别的财务报告文件,将其转换为图像格式,得到财报图像;对财报图像进行方向矫正,并擦除覆盖在财报图像上的遮盖物;采用第一预设深度学习算法检测财务图像上的表格的位置,并裁剪出表格区域;在表格区域中,采用第二预设深度学习算法检测表结构的单元线,根据所述单元线划分单元格;对每个单元格进行中心化处理,以提取每个单元格的信息;对提取得到的信息按照科目类别进行标准化,以统一描述形式,得到识别结果;根据业务场景,将识别结果进行结构化输出。本发明提供的方法能够在复杂环境下准确检测并识别财务报告文档中的关键信息,实现自动化地文档管理和处理。
技术关键词
自然场景
深度学习算法
识别方法
图像
表格
检测表
生成对抗网络训练
矫正
文本分类算法
深度学习训练
财务
印章
识别装置
日期
输出模块
数据项
可读存储介质
对比度
系统为您推荐了相关专利信息
行人重识别数据
索引
列表
重识别方法
深度残差网络
定位检测系统
微动平台
滑动导轨
载物台
直线电机
注意力
图像生成方法
计算机可执行指令
生成焦点
文本
心电监护仪
远程服务器
处理器模块
图像识别单元
正弦波
三维模型方法
专用服务器
资产
管理器
三维模型文件格式