摘要
本发明属于计算机应用技术领域,具体涉及一种多语种医案的实体关联方法,包括如下步骤:对医案中的原始句子进行头部实体和尾部实体识别;基于不同语种的医学术语对照数据,构建包含不同语种对应实体的词典,使用在线翻译API将不同语种的实体翻译成统一的目标语言,使用预训练的多语言词嵌入模型将不同语种的实体映射到相同的嵌入空间,用余弦相似度度量方法计算不同语种实体的相似度,对相似度得分最高的实体进行实体对齐;根据实体与实体间的关系构建知识图谱,以实现实体关联;本发明提升了知识图谱的关系准确性、实用性和包容性,推动医疗信息化和全球化的研究与应用。
技术关键词
实体关联方法
上下文语义信息
词嵌入模型
搜索方法
预训练语言模型
度度量方法
构建知识图谱
线性分类器
三元组
文本
穴位
自然语言
关系
矩阵
标注工具
词典
医学