摘要
本申请公开印前电子文件比对方法、设备及存储介质,涉及图像显示领域。对输入电子文件进行超分辨率重建,识别和划分出文字、图形、化学公式区;提取文字语义特征,生成目标文字区带有语义标注的中间文件;将化学公式转换为指纹编码,通过化学式拓扑分析提取拓扑结构特征;将图形进行格式转换,根据像素坐标点和图像形状提取图形特征矩阵;利用规则引擎和药品行业规范库对多模态语义特征、拓扑结构特征,以及图形特征矩阵进行差异化匹配检测,输出包含置信度评分的差异报告。该方案融合多模态特征提取、动态规则引擎与行业知识库,构建了面向药品包装领域的印前比对新范式,解决小文字漏检、化学式误判、多语言歧义的问题。
技术关键词
文件比对方法
拓扑结构特征
语义特征
多尺度特征金字塔
超分辨率
药品行业
指纹
损失函数优化
实体间关系
条件随机场
矩阵
化学式
动态规则引擎
电子
节点特征
控制点
术语
图像
编码