一种符合E2B标准的XML文件生成方法、系统、设备及介质

正文

推荐专利

申请号：CN202511022852

申请日期：2025-07-24

公开号：CN120951942A

公开日期：2025-11-14

类型：发明专利

摘要

本发明提供了一种符合E2B标准的XML文件生成方法、系统、设备及介质，涉及医药监管数据提交领域，其方法包括以下步骤：对输入的PDF文件进行预处理，生成标准化图像序列；通过多模态AI视觉模型识别图像序列中的文本、表格及公式元素，并结合医药领域词典进行语义纠错生成结构化数据；基于预设的E2B语义映射规则，将所述结构化数据转换为XML节点标签；将XML节点标签注入动态构建的XSD模板，通过多层校验生成初始XML文件；结合自适应复核机制，输出标准化XML文件。其通过多模态AI视觉模型、UMLS医学本体库、XSD驱动校验及自适应复核机制，实现了非结构化医疗文档到E2B标准XML的高精度、合规且可信的转换。

技术关键词

文件生成方法生成结构化数据医药知识图谱多模态语义节点文件生成系统标签孪生神经网络流水线架构动态纠错序列嵌套表格识别置信度图像文本 CRF模型视觉编译规则

系统为您推荐了相关专利信息

风电设备小目标检测方法、装置及电子设备

特征融合网络融合特征风电设备注意力语义特征

基于大语言模型的GIS软件交互实现方法及系统

大语言模型 GIS软件 GIS功能意图文本

基于地震断层分割模型的断层检测的方法、装置及设备

多尺度语义特征采样模块编码器卷积模块解码器

一种融合多支路神经网络的图像翻译方法

翻译模型深度特征提取网络图像翻译方法图像转换模型无标签数据

一种基于深度学习的跨模态图像文本检索方法

文本检索方法 BERT模型图像特征提取自然语言文本图像共享特征

一种符合E2B标准的XML文件生成方法、系统、设备及介质

站点导航

APP 下载