摘要
本发明实施例涉及一种用于PDF文件分子结构解析的处理方法和装置,所述方法包括:为PDF文件设置状态机;状态机为待解析时进行PDF文件图像转换、为一阶段时进行目标检测、为二阶段时进行结构化数据提取、为三阶段时进行化学语义检查、为四阶段时进行人工检验;并在待解析状态下出现异常时进行自动预警,在一、二、三、四阶段状态下出现异常时进行自动回退;并在四阶段时通过可视化方式对重建结构的个体对象与原始单页图像的图像位置进行动态关联。通过本发明可以提高分子结构解析任务的处理效率。
技术关键词
状态机
阶段
拓扑图
分子
画板工具
图像
可视化结构
模式
可视化方式
对象
序列
标识
基团
接口
矫正工具
语义
数据接收模块
识别工具