摘要
本发明公开了一种基于OCR和MLLM的医疗表单数据识别方法及系统,该方法包括:接收原始图像数据,通过自适应对比度增强、区域重要性加权和多分辨率优化,生成优化图像序列;基于优化图像序列进行特征提取,构建文本‑空间注意力图,实现文本识别;对优化图像序列和文本识别结果进行视觉编码和文本编码,通过特征对齐得到统一特征表示;基于统一特征表示构建信息层次图,进行关系推理,结合专业知识验证得到结构化特征信息;对结构化特征信息进行数据校验,得到规范化数据。本发明实现了医疗表单的高效识别和准确结构化,提升了医疗数据的数字化效率。
技术关键词
数据识别方法
矩阵
视觉特征
文本特征向量
注意力
多分辨率
表单
关系
原始图像数据
局部统计特征
卷积神经网络提取图像特征
序列
局部结构特征
上下文特征
文本识别模型
专业知识库
系统为您推荐了相关专利信息
摄像头自校准方法
云端服务器
参数
图像
摄像头校准技术
信号接收装置
信号发射装置
入侵报警系统
控制器
电梯控制系统
直流输电系统
阻抗建模方法
阻尼回路
脉动换流器
模型控制系统