摘要
本发明提出了基于知识表示学习和约束聚类的医学实体对齐方法及系统,属于医学知识图谱领域;方法包括:对待对齐的医学知识图谱进行预处理;获取医学知识图谱实体的结构嵌入、语义嵌入和属性嵌入;采用多头注意力机制融合结构嵌入、属性嵌入和语义嵌入,得到最终实体嵌入;计算最终实体嵌入之间的余弦相似度,采用Canopy聚类算法进行预聚类,将最终实体嵌入划分为多个重叠的簇;在所述簇内采用带约束的DBSCAN聚类方法进行二次聚类,将相似的实体聚集到同一个簇中,形成簇的集合;使用匈牙利算法提取每个簇中实体的一对一的对齐结果,输出对齐的实体对集合。能够有效解决标注数据不足问题、异构性问题和长尾实体对齐困难问题,提高实体对齐的准确率。
技术关键词
医学知识图谱
实体对齐方法
匈牙利算法
多头注意力机制
语义
矩阵
无监督聚类
对齐系统
索引
多模态
文本
邻域
处理器
程序
系统为您推荐了相关专利信息
智能测试方法
综合评估模型
规划算法
生成测试报告
智能测试系统
轮式机器人
智能巡检方法
巡检路径
车间
监控设备