摘要
本发明适用于版面分析存储方法技术领域,提供了一种基于智能识别的标准版面分析与结构化存储方法,包括以下操作步骤:S1、数据标注:将与机器人的安全与可靠性标准相关的标准pdf文档转换为图片形式,并对其进行二值化处理,以去除图片水印,并对图像进行数据标注,获得标准图像;S2、坐标信息:通过多尺度信息融合的版面分析网络,对S1中获得的标准图像进行版面分析。该基于智能识别的标准版面分析与结构化存储方法,减少了机器人标准文档的内容的检索时间并且有效还原了目录结构信息,减少了文档的存储消耗,提高了文档的阅读效率,方便用户获取机器人标准文档的文本信息,提高阅读效率。
技术关键词
结构化存储方法
融合多尺度信息
分析存储方法
信息还原方法
网络
机器人
图像
目录
多尺度特征融合
模块
随机梯度下降
标签
预测阈值
坐标
文本
图片
布局结构
语义
水印