摘要
本申请公开了一种面向医疗化验单的智能解析方法及其系统,其深度集成了表格结构检测与光学字符识别技术,针对解决医疗领域数据稀缺问题,本申请对CMDD数据集进行了系统性分析与数据增强,以扩展训练样本规模;在表格检测方面,基于TableNet架构,探索了多种特征提取网络的性能,并创新性地引入了Transformer注意力机制和特征金字塔网络FPN模块,从而提升了检测精度(IoU达到0.8423)和环境适应性;OCR阶段,通过系统性评估发现TableNet‑ResNet34+Transformer结合PaddleOCR的组合方案在医疗化验单的结构化信息提取任务中表现最优。
技术关键词
智能解析方法
深度学习模型
化验单
金字塔特征
表格特征
光学字符识别技术
生成二值化图像
生成表格数据
智能解析系统
特征匹配关系
框架
读取原始图像
特征金字塔网络
数据输出模块
文本