摘要
本申请公开了一种体检报告的结构化解析方法、装置、设备及存储介质。该方法包括:将获取的体检报告转换为统一格式的图片集;分别提取出所述图片集中每张图片各自对应的多个文本块以及每个文本块的图片坐标位置,构建出文本与页面布局之间的关系;将所述图片集、每张图片各自对应的多个文本块以及每个文本块的图片坐标位置输入训练好的多模态大语言模型中进行实体识别,能够全面结合文本、页面布局以及图片特征,更加准确地确定出每个文本块各自对应的实体词;基于所述每个文本块各自对应的实体词,生成所述体检报告对应的结构化数据,加强了对体检报告的文本解析能力,提高了结构化解析结果的准确性。
技术关键词
图片
大语言模型
结构化解析方法
文本特征向量
图像特征向量
报告
计算机执行指令
坐标
实体关系抽取
图像处理单元
生成结构化数据
注意力机制
序列
识别模块
可读存储介质
多模态
系统为您推荐了相关专利信息
强化学习策略
视觉设备
计算机可读指令
机器人
场景
大语言模型
学习训练方法
学习训练装置
计算机程序产品
指标
图像加密方法
图像识别模型
图像像素
注意力机制
图像加密系统