摘要
本发明涉及一种针对医学领域的专业性知识图谱构建方法,包括以下步骤:获取多模态医学文档,采用基于Transformer的多模态模型进行深度解析,获得解析后的多模态医学文档;采用基于上下文的自适应文本切块方法对所述解析后的多模态医学文档进行动态分割,得到独立文本块;基于所述独立文本块,进行结构化抽取,并采用动态双重校验机制进行校验,形成知识子图;基于所述知识子图,进一步构建为标准化的医学知识图谱。与现有技术相比,本发明具有精度高、可扩展等优点。
技术关键词
知识图谱构建方法
医学知识图谱
文本
医学专用
多模态
切块方法
表格
图表
实体
关系
校验机制
医学术语库
编辑距离算法
术语标准化
视觉特征提取
训练语言模型
置信度阈值
布局